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Prefácio & Agradecimentos 


Este livro tem como objetivo principal o estudo da síntese de sistemas de controle 
automático. De forma natural, surgiu a partir da necessidade de complementar a 
análise de sistemas dinâmicos já tratada no texto 


e J. C. Geromel e A. G. B. Palhares, Análise Linear de Sistemas Dinâmicos : 
Teoria, Ensaios Práticos e Exercícios, Editora Edgard Blücher Ltda, 2004. 


e cujo conteúdo tomamos como base para elaborar e desenvolver aquele que será, 
em seguida, apresentado. As estruturas dos dois livros são idênticas. 

Este texto não é um mero amontoado de resultados teóricos já conhecidos há 
muito tempo, de exemplos e exercícios que acabaram sendo colocados juntos. É 
muito mais. Pretendemos dar ao leitor a nossa visão e a nossa opinião crítica a 
respeito dos temas tratados. (Como apareceram, como são usados e, sobretudo, 
quais são os mais relevantes e úteis. Para que isto possa ser realizado é necessário, 
em alguns pontos, aprofundar a discussão e chegar a detalhes para tornar possível 
entender as nuances, porventura existentes, dentro dos seus respectivos contextos. 

Com este objetivo em vista, procuramos primeiramente desenvolver os resultados 
teóricos de forma rigorosa e sempre dentro de um nível de dificuldade que julgamos 
ser perfeitamente adequado aos potenciais leitores. Em segundo lugar, procuramos 
ilustrar os resultados teóricos com vários exemplos e propor diversos exercícios para 
serem resolvidos como forma de consolidar o aprendizado. Embora a bibliografia 
contenha um bom número de obras correlatas para consulta, este livro pode ser 
lido sem que se tenha que recorrer a elas com regularidade. Pretendemos ter feito 
um texto de leitura fácil e agradável mas reconhecemos que ele requer trabalho e 
dispêndio de energia para ser vencido. Alguns tópicos vão além do que se espera 
ensinar em disciplinas da graduação. Eles foram incluídos para dar ao conteúdo uma 
certa completude e colocar em evidência a temática atual da área como é o caso de 


controle robusto e das desigualdades matriciais lineares!. A leitura e o aprendizado 
certamente ficam mais fáceis se algum tipo de apoio computacional estiver disponível 
para que o leitor possa reproduzir os exemplos resolvidos. 
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l Tradução do termo original em Inglês, linear matrix inequalities ( LMIs) 


Capítulo 1 


Considerações Preliminares 


1.1 Introdução 


Place Wilson, centro de Toulouse, França, ao descer por uma escada rolante 
chega-se a uma estação de metrô completamente cercada por vidros. Ao contrário 
de muitas outras, o passageiro apenas percebe, através deles, a existência de uma 
linha férrea. O trem chega, um pequeno silvo avisa a abertura das portas, duas, 
a da estação e a do trem, entra-se e a composição se põe em marcha. Um trem 
pequeno, apenas dois vagões modernos, amplos e absolutamente idênticos. Nota- 
se os passageiros e mais ninguém. O trem não tem condutor! É completamente 
automático. Um sistema centralizado controla a operação de todos os trens do metrô 
de Toulouse. 

O objetivo central deste livro é estudar os chamados sistemas de controle au- 
tomáticos. Em síntese, deseja-se fazer com que um determinado objeto ou disposi- 
tivo se comporte de maneira previamente estabelecida, sem que seja necessária a 
intervenção de algum agente externo. Como no mundo real, incertezas e imprecisões 
estão sempre presentes. A dificuldade maior está em desenvolver um mecanismo 
de controle que mesmo diante de circunstâncias adversas ou desconhecidas, seja ca- 
paz de atuar de maneira satisfatória. Isto é, levando em conta diversos aspectos 
relevantes como por exemplo custos reduzidos de operação, simplicidade de imple- 
mentação, desempenho, conforto, segurança etc.. 


Vamos ilustrar o que acabamos de afirmar através de um piloto automático, 
dispositivo já bastante comum nos automóveis atuais. Enquanto o piloto automático 
estiver em operação, para que o automóvel percorra uma certa distância, deseja- 
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se manter a sua velocidade va(t) constante e igual à velocidade ve definida pelo 
condutor. Com este fim, podemos conceber duas estratégias que proporcionam 
resultados diversos, a saber: 


e No início do percurso, em t = 0, o condutor coloca o automóvel na velocidade 
desejada va(0) = ve e liga o piloto automático. Este, através de uma simples 
leitura determina e mantém para todo t > 0 o mesmo fluxo de combustível 
u(t) = uo injetado no motor em t = 0. Esta estratégia que poderíamos classi- 
ficar como ingênua não corresponderá às nossas expectativas. De fato, o perfil 
da estrada, o atrito dos pneus com a pista, o atrito viscoso com o ar, e demais 
variáveis que influenciam a marcha do automóvel no decorrer do percurso faz 
com que sua velocidade não permaneça constante como desejado. Essa es- 
tratégia que depende apenas de informações colhidas em t = 0, ou seja, antes 
do início do evento é denominada estratégia de controle em malha aberta. 


e Em qualquer instante de tempo t > 0 o velocímetro do automóvel mede a sua 
velocidade va(t) e determina o erro e(t) = va(t) — ve. O fluxo de combustível 
injetado no motor é imposto pela relação ù(t) = —kce(t), sendo ke > O um es- 
calar adequado. Em qualquer instante de tempo t > 0, se e(t) > 0 a velocidade 
do automóvel excede ve e o fluxo de combustível é reduzido (pois ù(t) < 0), 
fazendo com que a sua velocidade diminua. Ao contrário, se e(t) < 0 a ve- 
locidade do automóvel é menor que ve e o fluxo de combustível é aumentado 
(pois ù(t) > 0) fazendo com que a sua velocidade também aumente. Se algum 
fator externo influenciar a marcha do automóvel, o mesmo mecanismo entra 
em ação para eliminar o erro de velocidade e(t) # O que vier a ser produzido. 
Essa estratégia que depende de informações colhidas para todo t > 0, ou seja, 
durante toda a duração do evento é denominada estratégia de controle em 


malha fechada. 


Este exemplo retirado do nosso cotidiano, coloca em evidência que a estratégia 
de controle em malha fechada é a mais adequada e, portanto, deve ser adotada 
como estrutura fundamental para o projeto de sistemas de controle. O propósito 
deste livro é estudar os seus mais variados aspectos dentre os quais ressaltamos 
as suas bases teóricas e suas limitações práticas. De forma esquematizada, uma 
estrutura de controle em malha fechada pode ser representada através do diagrama 
mostrado na Figura 1.1. No caso do exemplo que acabamos de discutir, o bloco 
“Sistema Dinâmico” deve explicitar um modelo matemático que permita determinar 
a velocidade do automóvel va(t) a partir de um fluxo de combustível u(t) dado. 
Considerando m a massa do automóvel, b o coeficiente de atrito viscoso entre ele e 
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Referência a Saída 
T = Dinâmico | 


Medidor 


Figura 1.1: Estrutura de controle em malha fechada 


o ar, u O coeficiente de atrito seco entre a estrada e os seus pneus e fa(t) a força 
produzida pelo seu motor, adotamos o modelo simplificado 


ma + bta + mg(sen(0) + ucos(0)) = fa (1.1) 


que descreve o comportamento dinâmico do automóvel quando transita em uma 
estrada com inclinação constante 6 em relação à horizontal, sendo xa(t) a sua 
posição medida em relação a um referencial inercial acoplado à estrada. Finalmente, 
supondo que a força produzida pelo motor seja proporcional ao fluxo de combustível 
falt) = kau(t), lembrando que va (t) = ta(t), obtemos o modelo descrito pela equação 
diferencial de primeira ordem com coeficientes constantes 


mva + bva + mg(sen(0) + ucos(0)) = kau (1.2) 


O bloco “Medidor” representa o modelo do medidor utilizado. Idealmente o seu mo- 
delo é um simples ganho unitário indicando que ele fornece, sem erro ou distorção, 
o valor exato da variável medida. No exemplo que estamos tratando, consideramos 
que dispomos de um velocímetro ideal. O bloco indicado por “?” representa o 
“Controlador” a ser projetado. No exemplo em estudo, para todo t > 0, a sua 
saída fornece o fluxo de combustível u(t) a ser injetado no motor do automóvel, em 
função do erro de velocidade e(t) = valt) — ve, sendo va(t) a grandeza medida e ve 
a “Referência” que explicita o paradigma estabelecido no projeto. 

Derivando a equação (1.2) em relação ao tempo e lembrando que ù = —kce, 
obtemos a equação diferencial linear de segunda ordem com coeficientes constantes 


me + be + kakce = 0 (1.3) 


que rege o comportamento do erro de velocidade do piloto automático, segundo o 
diagrama de blocos da Figura 1.1. Podemos verificar, e este será um tema importante 


4 — CAPÍTULO 1. CONSIDERAÇÕES PRELIMINARES 


Figura 1.2: Estrutura de controle em rede 


a ser tratado em seguida, que ao resolvermos esta equação diferencial teremos 


dim e= - (1.4) 
quaisquer que sejam suas condições iniciais e(0) e é(0). Ou seja, após um período de 
transitório o qual desejamos seja bastante breve, a velocidade do automóvel torna-se 
aquela estabelecida pelo condutor. É claro que as raízes da equação característica 
do erro de velocidade dependem do coeficiente ke > 0 que faz parte do projeto do 
sistema de controle. Portanto, devemos determiná-lo de tal forma a atender algum 
critério de desempenho. Se o critério for fazer com que o erro reduza-se o mais 
rapidamente possível, a escolha adequada é ke = b2/(A4mka). Estas considerações, 
inclusive em relação a sistemas de controle mais complexos, serão objeto de análise 
nos capítulos seguintes. 

No futuro próximo, e já, em alguma medida, nos tempos atuais, a estrutura 
de controle em malha fechada, que acabamos de discutir, deverá ser modificada 
para acolher a possibilidade de que o sistema dinâmico que se quer controlar não 
esteja próximo do controlador. De fato, devemos supor que com o uso mais intenso 
de tecnologia digital e da internet, o objeto que se quer controlar e o controlador 
podem ter distâncias expressivas entre si. Neste contexto, a estrutura de controle 
passa a ser aquela descrita na Figura 1.2. 


O bloco “Sistema” corresponde ao objeto que se deseja controlar, em cuja entrada 
está situado o bloco “A”, que representa um atuador, dispositivo responsável pela 
geração do sinal de controle adequado. O bloco “S” representa um sensor, que nada 
“mais é que um dispositivo responsável pela medida da saída de interesse. Estes 
dois dispositivos estão ligados ao bloco “C” que indica o controlador, isto é, um 
micro-processador que tem no seu interior as regras necessárias para definir, em 
cada instante de tempo, a entrada de controle a ser sintetizada pelo atuador, tendo 
em vista as medidas colhidas pelo sensor. As linhas tracejadas indicam que as 
informações entre os blocos “C > A” e “C — S” são enviadas através de uma rede 
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de comunicação. Sob determinadas condições, devido à ocorrência de atrasos ou de 
erros de transmissão e de roteamento significativos, é imperativo que um modelo 
matemático da própria rede seja incorporado ao projeto do controlador. 

Como ilustração, consideramos o seguinte exemplo: Um braço mecânico com 
massa m e momento de inércia J relativo ao seu centro de massa situado a uma 
distância £ da sua base, tem um ponto de rotação fixo em um plano horizontal. 
Sendo & o ângulo entre o braço e o plano horizontal, o objetivo é deslocá-lo de uma 
posição inicial qualquer até uma posição pré-determinada Ópa € [0, 7/2] através da 
aplicação de um torque externo G na sua base. Assumimos que o braço se desloca 
em um ambiente desprovido de qualquer tipo de atrito. Utilizando o Teorema dos 
Eixos Paralelos para calcular o momento de inércia do braço em relação ao ponto de 
rotação, os momentos angulares em relação a este mesmo ponto permitem escrever 
a equação diferencial não linear de segunda ordem 


(J + MEE) + mgtcos(P(t) = G(t) (1.5) 


sujeita às condições iniciais Q(0) e ġ(0). Para impormos que após um certo tempo, o 
denominado período transitório, possamos ter d(t) = pa, é imperativo que o torque 
aplicado se torne constante G(t) = Gpa € igual a 


Gpa = mgtcos(Ppd) (1.6) 


Por outro lado, introduzindo as novas variáveis e(t) = A(t)—dpa e u(t) = G(t)—Gpa, à 
aproximação linear fornecida pela série de Taylor permite obter a equação diferencial 
linear de segunda ordem 


(J + me?) e(t) — mgtsen(Ppa)elt) = u(t) (1.7) 


com condições iniciais e(0) e ė(0), válida em uma vizinhança da solução em que 
estamos interessados, ou seja, (t) = pa- Instalando sensores que são capazes de 
medir a posição e a velocidade angulares do braço, a lei de controle bastante simples 


u(t) = —kpe(t) — kyé(t) (1.8) 


faz com que o sistema em malha fechada, sob sua ação, se comporte segundo a 
equação diferencial linear homogênea obtida substituindo-se (1.8) em (1.7), cuja 
equação característica pode ser escrita na forma 


(J + me + kà + (kp — mgtsen(bpa)) = 0 (1.9) 
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Assim sendo, se escolhermos kp > mg! > mgtsen(dpa) € ky > 0, as suas duas raízes 
estarão localizadas no semiplano complexo esquerdo, fazendo com que e(t) — 0 e, 
por conseguinte, (t) —> pa quando t — oo. É claro que esta afirmação é válida 
para o sistema aproximado descrito pela equação diferencial (1.7) mas pode não 
ser válida (note que as condições iniciais são consideradas arbitrárias) quando ele 
é substituído pelo sistema original não linear (1.5). Este aspecto será validado por 
meio de simulações dadas em seguida. 

Por outro lado, ainda não levamos em conta a existência da rede de comunicação. 
Vamos assumir que ela transmite os dados sem introduzir (idealmente) nenhum erro 
mas que a ação de controle só se efetiva após um tempo 7, que corresponde ao atraso 
total devido a transmissão das medidas do sensor para o controlador, seu tempo de 
processamento e a transmissão do sinal de controle para o atuador. Dessa forma, a 
mesma lei de controle (1.8) se torna 


ult) = —kpe(t — 7) — kyê(t — 7) (1.10) 


a qual, substituída em (1.7), faz com que a equação característica do sistema em 
malha fechada seja dada por 


(J + mt) + kye TA + (kpe TA — mgtsen(Gpa)) = 0 (1.11) 


A comparação de (1.9) e (1.11) revela alguns aspectos importantes. Enquanto a 
primeira é algébrica e admite duas e somente duas soluções que são facilmente de- 
terminadas, a segunda é transcendental e admite infinitas soluções que geralmente 
são muito difíceis de serem determinadas, mesmo numericamente. Assim sendo, não 
é surpresa que estudar a estabilidade de um sistema com atraso seja uma tarefa 
mais complicada que estudar a estabilidade de um sistema sem ele. Porém, por con- 
tinuidade, se as duas raízes de (1.11) para 7 = 0 estiverem situadas no interior da 
região Re(A) < 0 do plano complexo, então existirá um valor máximo Tmar > 0 de 
tal forma que todas as raízes da equação (1.11) estejam localizadas na mesma região 
para todo 7 € [0, Tmar). Como no caso em que adotamos uma aproximação linear 
para simplificar o modelo matemático de um sistema dinâmico, a implementação de 
uma lei de controle projetada idealmente para 7 = 0 através de uma rede de comu- 
“nicação, requer a sua validação para verificar se o desempenho final não será com- 
prometido pela presença inevitável de atrasos. Para melhor ilustrar o que acabamos 
de dizer, adotamos os valores numéricos J = 0,5 [kgm?], m = 6,0 [kg], £ = 0,5 [m], 
g = 9,8 [m/s?] e doa = 7/3 [rad]. Com (1.6) determinamos o torque de equilíbrio 
como sendo Gpa = 14,7 [Nm] e os ganhos kp = 27,46 e ky = 4, de tal forma que as 
raízes da equação característica sejam duplas e iguais a —1. 


1.1. INTRODUÇÃO T 


Figura 1.3: Simulação do braço mecânico com controle via rede 


A Figura 1.3 mostra a simulação temporal de duas situações que permitem colo- 
car em evidência os efeitos da não linearidade do sistema e da presença da rede 
de comunicação que é usada para enviar os sinais de comando. Em t = 0 o braço 
mecânico encontra-se em repouso na posição horizontal, isto é (0) = (0) = 0, e 
deve se deslocar até a posição final correspondente a @pa = 60º. 

A parte superior daquela figura foi obtida com 7 = 0, ou seja, com uma rede 
de comunicação ideal. Em linha contínua, vemos o deslocamento angular do braço 
segundo o modelo não linear (1.5). Em linha tracejada, vemos o mesmo deslocamento 
angular mas segundo o modelo linear (1.7). Em ambos os casos, a mesma lei de 
controle (1.8) foi adotada. Nota-se uma diferença acentuada entre as duas trajetórias 
no início mas, após um certo intervalo de tempo, ambas coincidem. Nos dois casos, 
o braço atinge a posição previamente estabelecida. 

A parte inferior da mesma figura foi obtida com r = 130 [ms]. Notamos que, 
devido ao atraso introduzido pela rede de comunicação, ambos os modelos predizem 
oscilações significativas para o braço durante o seu deslocamento. A linha tracejada 
correspondente ao modelo linear mostra que o braço atinge a posição desejada. Ao 
contrário, a linha contínua mostra que o mesmo controlador não é capaz de fazer com 
que o braço tenha o mesmo desempenho. Ele atinge a posição de equilíbrio Peq = 
131º, distante daquela previamente especificada e, portanto, inaceitável. Podemos 
determinar que todos os pontos de equilíbrio do sistema (1.5) sob a ação do controle 
(1.8) satisfazem a equação 


mgl (cos(Peg) — cos(Ppa)) + kp(Peg — Ppa) = O (1.12) 
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Como não poderia deixar de ser, uma das soluções é peq = pa, mas existem outras. 
Em sistemas não lineares a ocorrência de situações semelhantes é bastante comum. 
Sempre via simulação numérica, determinamos que ambos os modelos tornam-se 
instáveis para T > Tmar œ% 140 [ms]. É importante ressaltar que ilustramos ape- 
nas um aspecto de uma rede de comunicação presente em um sistema de controle, 
qual seja, a introdução de atrasos que podem deteriorar o seu desempenho final 
e cujo efeito deve ser cuidadosamente avaliado. Devido à ocorrência de atrasos 
variantes no tempo e de perdas, modelos mais sofisticados baseados em proces- 
sos estocásticos são mais adequados e devem, quando possível, ser adotados. Nos 
próximos capítulos, eventuais atrasos presentes em sistemas de controle serão objeto 
de nossa preocupação e estudo. 

Uma outra situação bastante relevante em sistemas de controle diz respeito à 
implementação física de um controlador projetado. É claro que se deve lançar mão 
das facilidades tecnológicas existentes para ganhar em precisão e reduzir custos. 
Neste sentido, a adoção de tecnologia digital que permita implantar controladores 
programáveis ou micro-processadores dedicados parece ser a mais natural. Nova- 
mente, consideramos o exemplo do braço mecânico, sem atraso, para ilustrar nossas 
afirmações. Para implementar a regra (1.8) através de um dispositivo digital de 
controle, as quantidades medidas e(t) e e(t) são amostradas com um determinado 


período de amostragem T o que fornece, para todo k = 0,1,:-- os valores de e(kT) 
e e(kT). Desta forma podemos sem dificuldade calcular 
u(kT) = —kpe(kT) — kyė( kT) (1.13) 


nos diversos instantes de amostragem t = kT. É imperativo ficar bastante claro que 
com esse procedimento podemos dispor dos valores de controle fu(kT) Ro € com 
eles determinar os valores da função u(t) para todo t > 0. É claro que essa tarefa só 
pode ser realizada adotando-se alguma aproximação. A mais simples é certamente 
aquela que define o chamado segurador de ordem zero e pode ser assim descrita: Em 
um instante genérico t = kT, medimos e(kT), ė(kT) e calculamos com (1.13) o valor 
do controle u(kT) que é aplicado na entrada do sistema, permanecendo constante 
até o instante de amostragem seguinte t = (k + 1)T e assim sucessivamente. 

A Figura 1.4 mostra a simulação numérica do braço mecânico sob a ação do 
controle digital que acabamos de descrever. A parte superior, idêntica àquela da 
figura anterior, mostra o sistema sendo controlado com o controlador (1.8). Em linha 
contínua vemos a evolução do modelo não linear enquanto que em linha tracejada 


mostramos a do sistema linear. Em ambos os casos, em regime permanente, a posição 
final desejada é atingida. A parte inferior da mesma figura foi obtida adotando- 
se T = 300 [ms]. Em linha contínua, vemos a evolução do braço para a posição 


Figura 1.4: Simulação do braço mecânico com controle digital 


Peg * 131º que não é a desejada. Em linha tracejada, o modelo linear atinge a 
posição desejada mas somente após fortes oscilações. Estes dois aspectos indesejados 
resultam da implementação digital da lei de controle projetada com um período de 
amostragem que se mostrou excessivamente grande. Neste sentido, é importante 
ressaltar que para T > Tmar % 310 [ms], ambos os modelos tornam-se instáveis sob 
a ação da mesma lei de controle (1.13). Comparando as Figuras 1.3 e 1.4 nota-se uma 
semelhança importante, qual seja, os atrasos introduzidos pela rede de comunicação 
e o período de amostragem necessário para a digitalização do controle, atuam no 
sentido de deteriorar o desempenho final do sistema de controle projetado. 

Esses aspectos que acabamos de ilustrar e muitos outros serão objeto de estudo 
deste livro. Os resultados teóricos serão estudados com o rigor matemático que o 
tema exige mas com a preocupação de não ir além do ponto necessário. Questões 
de ordem prática serão discutidas e, sempre que possível, serão colocadas no atual 
contexto tecnológico. Diversos exemplos ilustrativos serão resolvidos e analisados 
como forma de facilitar a compreensão do texto. 


1.2 Requisitos Básicos 


O tema central a ser abordado neste livro requer do leitor alguns requisitos para 
que os conceitos sejam entendidos de maneira adequada. Na verdade, não é requerido 
que o leitor detenha algo além de conceitos básicos em matemática, cálculo opera- 
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cional, mecânica e eletricidade. Na medida do possível, informações suplementares 
a respeito dos tópicos tratados são fornecidas na forma de notas bibliográficas intro- 
duzidas no final de cada capítulo. A possibilidade de o leitor se dedicar à eventual 
atualização de alguns conceitos básicos nas áreas citadas, certamente fará com que 
a leitura se torne mais agradável e seja mais eficiente. Os exercícios propostos no 
final de cada capítulo devem ser resolvidos pois são importantes para consolidar o 
aprendizado. A seguir, discutimos um conjunto de requisitos necessários de forma 
um pouco mais detalhada: 


e Funções de Variáveis Complexas 


Trata-se de ferramenta importante para o tratamento de sistemas dinâmicos, 
tanto em tempo contínuo como em tempo discreto. Dominar o cálculo operacional 
envolvendo números complexos é essencial. Uma função de variável complexa associa 
elementos do plano complexo C a elementos pertencentes a este mesmo conjunto. É 
definida na forma f(z): D > C, onde D é um domínio situado em C. Estaremos 
particularmente interessados nas chamadas funções racionais, isto é, aquelas que são 
obtidas pela razão entre dois polinômios com coeficientes reais e de mapeamentos 
de curvas fechadas C inteiramente contidas no seu domínio, ou seja 


Cr=Lf(2) : ze C] (1.14) 


Em particular, o estudo de estabilidade de sistemas dinâmicos a partir do método 
de Nyquist é inteiramente dependente deste tipo de mapeamento. Os conceitos mais 
utilizados são tratados com mais vagar e detalhes em um dos capítulos seguintes. 


e Modelagem Matemática 


Construir modelos matemáticos simples e precisos é uma das mais importantes 
tarefas em ciência. A modelagem matemática resulta da aplicação de leis básicas 
existentes para descrever comportamentos mais complexos. Por exemplo, as leis de 
Newton são essenciais para se obter modelos matemáticos de sistemas mecânicos 
assim como as leis de Kirchhoff desempenham o mesmo papel para a modelagem de 
“circuitos elétricos. No presente contexto, em que se deseja projetar um dispositivo 
para controlar um determinado sistema dinâmico, a sua modelagem é absolutamente 
essencial, pois viabiliza que o projeto se realize tendo em mãos apenas o modelo e 
não o sistema físico propriamente dito. Ademais, o resultado final pode ser validado 
e o desempenho pode ser medido, submetendo-se o modelo a situações de operação, 
incluindo eventuais falhas, mais prováveis de serem encontradas na prática. Dessa 
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forma, a modelagem matemática constitui etapa estratégica e, portanto, impor- 
tante em todo projeto de sistemas de controle. Neste livro procuramos dar ênfase 
à obtenção de alguns modelos matemáticos de interesse bem como verificar as suas 
respectivas validades em um ambiente de laboratório. 


e Equações Diferenciais e Transformada de Laplace 


Em tempo contínuo, os modelos matemáticos a serem manipulados são descritos 
por equações diferenciais e, na maioria das vezes, equações diferenciais lineares com 
coeficientes constantes, ou seja, 


(1.15) 


onde D[] e N[] são operadores diferenciais de ordem n e m < n, respectivamente, 
que definem uma combinação linear da função e de suas derivadas sucessivas. À 
função y(t) para todo t > 0 é a incógnita que deve ser determinada dada a função 
de excitação u(t) para todo t > 0 e as condições iniciais que fixam os valores de y(t) 
e de suas derivadas sucessivas até a ordem n — 1 em t = 0. Sob a condição de que 
a função de excitação seja contínua, a solução de (1.15) existe, é única e pode ser 
expressa na forma padrão 


y(t) = vult) + DO cih: (t) (1.16) 


onde yu(t), denominada solução particular depende exclusivamente da entrada u(t) 
em consideração e as funções h;(t) para todo i = 1,:-- ,n, soluções da equação 
homogênea D[h;(t)| = 0, formam um conjunto linearmente independente que asse- 
guram a existência de constantes c;, + = 1,::-,n, capazes de impor as condições 
iniciais desejadas. Lembrando que a função exponencial e^t com À € C exibe a 
propriedade 


D[e*| = A(A)je™ (1.17) 


onde A()) é o polinômio característico (de grau n) do operador diferencial D|], 
ela é denominada auto-função, pois à semelhança dos autovetores de uma matriz, O 
resultado da aplicação do operador D[-] é uma função proporcional a ela própria. Ao 
impormos que o fator de proporcionalidade seja nulo, isto é A(A) = O obtemos uma 
equação algébrica de grau n com coeficientes reais que admite n e somente n raízes 
em C. Com estas raízes Àj, para todo i = 1,---n, podemos construir o conjunto 
de funções {h;(t)}; mesmo no caso em que as raízes da equação característica 
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A(A) = O não sejam simples, isto é, quando tenham multiplicidade maior do que 
um. Este é um tema importante que precisa ser dominado com desenvoltura. 

Uma maneira alternativa para descrever os modelos matemáticos que serão ma- 
nipulados é através do cálculo da sua função de transferência, que é obtida pela 
aplicação da transformada de Laplace. Sendo f(t) uma função de variável real, 
definida para todo t > 0, a sua transformada de Laplace é a função de variável 
complexa f(s) : DC dada por 


f(s) = a Tite dt | (1.18) 


onde o domínio D contém todos os pontos do plano complexo para os quais a integral 
(1.18) pode ser calculada, isto é, converge. E importante salientar que D tem a forma 
particular 


D=(seC: Re(s)>o! (1.19) 


sendo o € R o menor escalar de tal forma que f (s) seja analítica em todos os pontos 
do seu domínio. É imperativo observar que, por definição, a igualdade (1.18) só é 
verdadeira para os pontos s € D. Por exemplo, podemos determinar a integral de 
uma função através da sua transformada de Laplace com a relação 


f Kod = (0) (1.20) 


mas apenas se s = 0 € D, caso contrário o valor obtido não será correto. Um 
dos aspectos mais importantes da transformada de Laplace é que a transformação 
inversa sempre existe. Em outras palavras, a partir de f (s) e do seu domínio, 
podemos extrair a função original através de 


1 A 
t) = — “ds, t 1.21 
NO = g J 19d 10 (1.21) 
onde y é uma linha vertical inteiramente contida em D. Geralmente, essa integral 


pode ser calculada pelo método dos resíduos. No contexto de sistemas dinâmicos line- 
ares invariantes no tempo, é de particular importância a classe de funções racionais 


(1.22) 


onde D(s) e N(s) são polinômios com coeficientes reais de grau nem < n, respecti- 
vamente. As n raízes de D(s) = 0 são os polos e as m raízes de N (s) = 0 são os zeros 
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de f(s) Como ela deixa de ser analítica apenas nos pontos singulares isolados tais 
que D(s) = 0, o seu domínio é inteiramente caracterizado por seus polos. Ademais, 
T: ? 


a sua transformada inversa pode ser calculada sem grandes dificuldades através do 


seu desenvolvimento em frações parciais. 

Muito embora os sistemas físicos sejam geralmente descritos por modelos mate- 
máticos a tempo contínuo, a necessidade de implementar controles com tecnologia 
digital faz com que tenhamos que manipular equações a diferenças e suas respectivas 
transformadas Z. Felizmente, o estudo desse tipo de equações lineares a tempo dis- 
creto segue de perto aquele que acabamos de comentar para as equações diferenciais 


e a transformada de Laplace. 


e Simulação e Cálculo Numérico 


A análise e a síntese de sistemas de controle necessita cada vez mais da disponi- 
bilidade de um suporte computacional que permita manipular de forma amigável 
relações algébricas e diferenciais de grande complexidade. Ou seja, de ordem elevada 
e que eventualmente contenham não linearidades e misturem estruturas definidas em 
tempo contínuo e em tempo discreto. Nos dias atuais, os simuladores numéricos de 
sistemas dinâmicos são absolutamente essenciais na etapa de análise para validar 
os modelos adotados e na etapa de síntese para validar o desempenho dos contro- 
ladores projetados. O uso deste suporte computacional será ilustrado ao longo de 
todo este livro como forma de colocar em evidência a sua importância, inclusive, 
para o aprendizado dos conceitos introduzidos. 


1.3 Descrição dos Capítulos 


Em seguida passamos a descrever cada capítulo para que o leitor possa ter algu- 
mas informações preliminares a respeito dos seus respectivos conteúdos. O objetivo 
central é dar ênfase a pontos que julgamos importantes e que necessitam, desde logo, 
de particular atenção. 


e Cap. 2 : Fundamentos de Sistemas de Controle 


Neste capítulo introdutório, discutimos a estrutura básica de controle a ser ado- 
tada nos demais capítulos. O objetivo inicial é apresentar as estruturas de controle 
em malha aberta e em malha fechada e optar pela segunda, que permite obter 
melhores resultados, tendo em vista o desempenho do sistema de controle a ser 


14 CAPÍTULO 1. CONSIDERAÇÕES PRELIMINARES 


projetado. Entender esse ponto central dentro dos seus aspectos mais abrangentes 
é essencial para estabelecer uma base sólida a ser usada até o final. Em seguida, 
discute-se alguns critérios de desempenho e classes de controladores. Finalmente 
a implementação digital de controladores dinâmicos é abordada com detalhes. Os 
efeitos da discretização e a introdução de aproximações necessárias para viabilizar 
esta proposta são avaliados e discutidos. 


e Cap. 3 : Fundamentos Matemáticos 


Os resultados matemáticos mais expressivos a serem utilizados nos capítulos 
seguintes são analisados e discutidos com bastantes detalhes. De certa forma, di- 
recionamos a apresentação para as necessidades principais do leitor no sentido de 
minimizar a consulta de outros textos. As funções de variáveis complexas permitem 
explicitar o princípio da variação do argumento que progride naturalmente para 
o critério de estabilidade de Nyquist, talvez a mais interessante construção lógica 
dessa área. Além dele, nesse capítulo estudamos os critérios de estabilidade de 
Routh-Hurwitz e de Lyapunov. No caso de sistemas lineares invariantes no tempo, 
com função de transferência H(s) = N(s)/D(s), a estabilidade depende exclusiva- 
mente da localização dos seus polos, raízes da equação característica D(s) = 0, na 
parte esquerda aberta do plano complexo. Os critérios de estabilidade permitem 
verificar a localização das raízes de D(s) = 0 sem ter que resolvê-la. Ademais, 
permitem o estudo de estabilidade em um contexto mais geral. Por exemplo, de- 
terminar os valores do escalar x > 0 de tal forma que as raízes s(x) da equação 
algébrica D(s) + sN(s) = 0 estejam localizadas em uma determinada região do 
plano complexo. O lugar geométrico de todas as raízes da forma s(K),Vk > O é 
determinado de forma aproximada. 


e Cap. 4 : Fundamentos de Projeto 


Após a introdução de critérios de desempenho para os sistemas de controle em 
malha fechada traduzidos pela localização dos seus polos, eles são alocados nas 
posições desejadas através da solução de uma equação denominada equação Dio- 
“fantina. É de particular importância a solução aproximada proposta que viabiliza o 
projeto de controladores com estrutura simples, de baixa ordem. Os controladores 
clássicos que derivam da família PID (Proporcional + Integral + Derivativo) são 
descritos e projetados com o auxílio da regra de Ziegler-Nichols. Dois projetos com- 
pletos, envolvendo problemas práticos de reconhecida importância, são resolvidos e 
analisados em detalhes. 
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e Cap. 5 : Projeto via R epresentação de Estado 


A representação de estado de equações diferenciais, com particular ênfase ao 
caso linear, é um dos resultados mais notáveis para análise e síntese de sistemas de 
controle. O ponto central é que uma equação linear de ordem n pode ser convertida 
em um sistema de equações diferenciais de primeira ordem. Em outras palavras, 
troca-se a ordem pela dimensão como forma de viabilizar a adoção de métodos 
numéricos para tratar sistemas dinâmicos de qualquer ordem, exigindo eficiência 
e generalidade. Esse capítulo trata inicialmente do projeto que controladores via 
realimentação de todas as variáveis de estado. Em seguida, analisa o projeto de 
observadores levando em conta a existência de ruídos de medida e, finalmente, trata 
do projeto de controladores via realimentação de saída, que tem maior importância 
do ponto de vista prático. 

Todos os resultados se baseiam em uma equação matricial não linear denominada 
equação de Riccati a qual, na sua forma mais geral, é expressa por 


A'P+PA-PRP+Q=0 (1.23) 


com 4, Q e R matrizes reais quadradas e Q, R matrizes simétricas semidefinidas 
positivas. Procura-se uma solução simétrica definida positiva P > 0 tal que a matriz 
A- RP tenha todos os seus autovalores localizados no semiplano esquerdo complexo. 
Trata-se de uma equação matricial não linear que só pode ser resolvida numerica- 
mente com o auxílio de rotinas computacionais bem conhecidas. Entretanto, neste 
capítulo, daremos particular ênfase a um procedimento alternativo que, sem ter que 
passar pela solução da equação de Riccati, permite determinar o ganho associado à 
sua solução através da técnica de alocação de polos estudada anteriormente. 


e Cap. 6 : Sistemas Não Lineares 


Em geral, os modelos de sistemas dinâmicos são não lineares. Os movimentos 
de rotação, por naturalmente serem descritos com funções trigonométricas, são não 
lineares. Inicialmente, esse capítulo trata da aproximação linear de sistemas não 
lineares válida em uma vizinhança dos pontos de equilíbrio. Sistemas lineares de 
segunda ordem são estudados em detalhes através da determinação de trajetórias 
no plano de fase e da caracterização de soluções periódicas. O estudo da existência 
de trajetórias fechadas no plano de fase baseia-se em linearização harmônica cujo 
embasamento teórico é feito com o auxílio do critério de Nyquist. Passividade e 
Positividade Real, dois conceitos equivalentes, são usados como base para estabelecer 
os critérios de estabilidade que se aplicam a duas classes importantes de sistemas 
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não lineares, a saber o critério de Popov e o de Persidiskii. Uma função de variável 
complexa F(s): Dc C — C é positiva real se todos os seus polos estiverem 
localizados no semiplano esquerdo complexo e se 


Re(F(jw)) > 0, Yw E R (1.24) 


Neste capítulo, como forma de caracterizar a positividade real através de uma função 
de Lyapunov, verificamos a importância das chamadas desigualdades matriciais line- 
ares que são estudadas com maior rigor no Apêndice A. 


e Cap. 7 : Robustez 


Os sistemas dinâmicos são normalmente sujeitos a incertezas, em particular, in- 
certezas paramétricas. Este capítulo trata desta temática no âmbito da chamada 
Teoria Hoo. Inicialmente, o conceito de norma de vetores e de matrizes é intro- 
duzido para ser, em seguida, generalizado para funções de variáveis complexas que 
são analíticas no semiplano complexo esquerdo. Pertence a essa classe as funções de 
transferência racionais assintoticamente estáveis, para as quais definimos e tornamos 
operacional o cálculo das chamadas normas Hə e Hoo. Vários exemplos ilustrativos 
são resolvidos. Em seguida, dois aspectos centrais são considerados, a saber: esta- 
bilidade e desempenho robustos, em um contexto geral que resulta da aplicação do 
célebre teorema do pequeno ganho, responsável pela desigualdade 


[Moo lÁ lo < 1 (1.25) 


a qual se satisfeita assegura a estabilidade assintótica global onde H (s) é uma função 
de transferência nominal e A(s) é a sua incerteza. Particular atenção é dada às 
incertezas paramétricas e aos sistemas de controle com atraso. Embora tenhamos 
tido a preocupação de fazer com que as relações matemáticas não tornassem a leitura 
exageradamente difícil, este capítulo requer do leitor maior disponibilidade. A re- 


solução dos exercícios propostos no seu final permite aumentar o aprendizado de 
forma sensível. 


e Cap. 8 : Modelagem e Ensaios Práticos 


Dar ao leitor uma visão completa de como elaborar e desenvolver um projeto 
de controle é essencial para sedimentar o aprendizado do conteúdo dos capítulos 
precedentes. Assim sendo, este é o objetivo central deste último capítulo. Ele contém 
o desenvolvimento de dois projetos por inteiro, isto é, cada um deles se inicia com 
a modelagem matemática do sistema dinâmico em estudo, projeta-se o controlador 
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e, em seguida, verifica-se a sua validade e o seu desempenho frente aos critérios 
inicialmente estabelecidos. O primeiro trata de um sistema mecânico torcional cons- 
tituído por três discos rígidos conectados entre si por meio de duas hastes flexíveis. 
Deseja-se controlar a posição angular do terceiro disco através de um motor que está 
conectado ao primeiro. A dificuldade do projeto de controle reside na existência 
de uma estrutura flexível (as hastes e o segundo disco) entre ambos. O segundo 
projeto trata de um sistema elétrico constituído por dois amplificadores operacionais 
conectados em série. O ganho do conjunto é definido por um elo de realimentaçao 
que deve ser convenientemente projetado. A dificuldade de projeto concentra-se em 
operar o conjunto no seu limiar de estabilidade que deve ser melhorado através da 
introdução de um compensador. Em ambos os casos, as soluções propostas foram 
validadas em laboratório e os resultados experimentais são apresentados em detalhes. 


e Apêndice A : Desigualdades Matriciais Lineares 


Nesse apêndice, procuramos dar uma pequena ideia a respeito da importância 
atual, na área de sistemas de controle, das desigualdades matriciais lineares. Trata- 
se de uma restrição do tipo 


n 
Áo + ; A;x; <0 (1.26) 

i=1 
onde as matrizes quadradas Ao, 41,-:- , An são reais, simétricas e de mesmas di- 
mensões. Os vetores x = [£1 £n] E€ R” que satisfazem esta restrição formam 


um conjunto convexo. O Complemento de Schur, que permite converter muitas res- 
trições não lineares em desigualdades matriciais lineares, é provado e analisado de 
forma rigorosa. Neste contexto, problemas relacionados ao cálculo de normas Ho, 
Ha e com o cálculo de atraso máximo sem perda de estabilidade são abordados. 


1.4 Notação 


Neste ponto, cabe finalmente lembrar que a notação usada no decorrer do SERIO é 
padrão. Os símbolos R, N, Z e C denotam respectivamente os conjuntos dos números 
reais, naturais, inteiros e complexos. Para funções em tempo contínuo ou discreto 
são usadas letras minúsculas indicando sua variável independente t € R ou k eN, 
como por exemplo f(t) e f(k). A transformada de Laplace e a transformada Z de 
uma função a tempo contínuo f(t) ou de uma função a tempo discreto f(k) são 
denotadas indistintamente como f(s) ou f(z). Os seus respectivos domínios são de- 
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A 


notados também de forma indistinta como D(f) ou apenas D, ficando claro, no con- 
texto, se estamos tratando do domínio de uma transformada de Laplace ou de uma 
transformada Z. Sempre que possível, empregamos letras minúsculas para a res- 
posta ao impulso e a mesma letra maiúscula para denotar a função de transferência 
a ela associada. Da mesma forma, matrizes são denotadas com letras maiúsculas 
e vetores com letras minúsculas, assim 4 € R”*™ denota uma matriz real com n 
linhas e m colunas e v € R” denota um vetor real com n elementos, sempre con- 
siderado um vetor coluna. O vetor linha, transposto de v, é denotado por v’. Para 
números complexos z € C, empregamos z* para denotar o seu conjugado e para 
vetores ou matrizes complexas v € C” o seu conjugado transposto é denotado como 
v>. As operações de convolução em tempo contínuo e em tempo discreto são no- 
tadas f(t) * h(t) e f(k) e A(k), respectivamente. Finalmente, as derivadas primeira e 
segunda de uma função y(t), exclusivamente em relação ao tempo, são denotas por 
U(t), Y(t) ou por yH (t), yP (t) e, assim, sucessivamente. 


1.5 Notas Bibliográficas 


No final de cada seção, incluímos uma discussão a respeito da bibliografia disponí- 
vel sobre o tema tratado. Ela tenta dar ao leitor maiores informações quanto aos 
aspectos considerados importantes mas que foram tratados de forma subsidiária 
por fugirem do escopo central do livro. Um deles é, sem dúvida, a implementação 
numérica dos algoritmos de síntese de sistemas de controle. 

A bibliografia que se encontra no final deste livro contém as referências que 
julgamos bastante relevantes sob dois aspectos distintos. O primeiro diz respeito 
a resultados bem consolidados que são apresentados de maneira ou com propósito 
diversos e que devem ser conhecidos através de uma fonte de informação alternativa. 
Acreditamos que, dessa forma, o leitor possa ter uma visão mais abrangente do 
assunto. O segundo está ligado a resultados mais recentes, cuja fonte primária 
procuramos fornecer. Como toda bibliografia, a deste livro não é exaustiva nem 
completa mas deve ser tomada como um conjunto inicial de referências que precisa 
ser aprimorado segundo a opinião e o interesse específico do leitor. 


Capítulo 2 


Fundamentos de Sistemas de 
Controle 


2.1 Introdução 


Este capítulo tem por objetivo estabelecer os contornos dos problemas e das 
técnicas que serão abordados neste livro. O objetivo central é o de projetar con- 
troles para sistemas dinâmicos de tal forma que eles passem a se comportar segundo 
especificações previamente estabelecidas. Iniciamos com um exemplo bastante sim- 
ples, porém elucidativo. Um corpo de massa m = 1 [kg] move-se em um ambiente 
com coeficiente de atrito viscoso b = 2 [Ns/m], sob a ação de uma força externa com 
intensidade u(t) [N]. Em relação a um referencial inercial, a posição do móvel em 
qualquer instante de tempo, denotada x(t), pode ser calculada através da solução 
da equação diferencial de segunda ordem 


mällt) + belt) = u(t) (2.1) 


sujeita às condições iniciais «(0) e ¿(0) dadas. Considerando que em t = O [s] o 
móvel se encontra em repouso na posição x(0) = 10 [m], deseja-se trazê-lo para a 
posição x = 0 através da ação da força externa com intensidade adequada. Duas 
estratégias são adotadas, a saber: 


a) Aplicamos uma força u(t) = —4 [N] durante os primeiros 5 [s], o que faz com 
que o móvel atinja a velocidade de —2 [m/s], na posição 1 [m], em t = 5 [s]. 
Em seguida, adota-se u(t) = O [N] e o móvel, devido a ação do atrito viscoso, 
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Figura 2.1: Posição do móvel no decorrer do tempo 


atinge assintoticamente a posição desejada. Para todos os efeitos práticos, em 
t = 10 [s] o móvel lá se encontra. 


b) Em cada instante de tempo, medimos a posição do móvel em relação à posição 
desejada e aplicamos uma força com intensidade u(t) = —2a(t) [IN]. Nova- 
mente, para todos os efeitos práticos, em t = 10 [s] o móvel se encontra na 


posição desejada. 


A Figura 2.1 mostra a simulação numérica das duas estratégias que acabamos 
de discutir, considerando que para ambas o móvel parte do repouso nas posições 
r(0) = 10 [m] e z(0) = 11 [m], respectivamente. Como podemos notar, existe uma 
diferença importante entre os resultados obtidos. 

A estratégia a), representada pelas linhas contínuas, é caracterizada pelo fato de 
termos determinado a função do tempo u(t) a ser aplicada. Para a condição inicial 
«(0) = 10 [m] ela funciona muito bem tendo em vista que o carro para na posição 
desejada. Porém, quando aplicamos a mesma estratégia para uma condição inicial 
ligeiramente diferente, isto é v(0) = 11 [m], aquele requisito deixa de ser atendido. 
Ou seja, essa estratégia é sensível à existência de eventuais erros que sempre estão 
presentes em qualquer sistema real. À lei de controle u(t), assim obtida, é denomi- 
nada controle em malha aberta pois não usa nenhuma informação adicional, 
além daquelas disponíveis no instante inicial t = 0. 

A estratégia b), representada pelas linhas tracejadas, não sofre do inconveniente 
que acabamos de apontar. Ao mudarmos a condição inicial, ela modifica a força 
para fazer com que o móvel pare no lugar desejado. A lei de controle u(t), assim 
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obtida, é denominada controle em malha fechada pois usa em todo instante t > 0 
novas informações, neste caso, obtidas através da medida do erro da posição atual 
o móvel z(t) em relação à posição final desejada x = 0. 

Por este motivo, dentre vários outros que discutiremos no decorrer deste texto, 
podemos afirmar que a estrutura de controle em malha fechada é a mais adequada 
para ser adotada no controle de sistemas dinâmicos em geral. De fato, a estrutura 
de controle em malha fechada permite acomodar (até determinados limites a serem 
discutidos mais adiante) erros ou imprecisões sempre presentes em sistemas reais. 


2.2 Modelagem Matemática e Perspectivas 


Como sabemos, sistemas dinâmicos são descritos por equações diferenciais (tem- 
po contínuo) ou por equações a diferenças finitas (tempo discreto). De maneira geral 
são não lineares e, portanto, não podem ser resolvidas de forma fechada. Aproxi- 
mações lineares são então adotadas como forma de representar fenômenos de in- 
teresse por modelos mais simples, embora válidos apenas sob condições restritas a 
serem adequada e precisamente explicitadas. Assim sendo, neste contexto, devemos 
manipular equações diferenciais ou equações a diferenças, de ordem arbitrária, com 
coeficientes constantes, escritas na forma 


Diy] =g (2.2) 


onde D|-| é um operador diferencial ou um operador a diferenças finitas que relaciona 
a função de entrada g(:) com a função de saída y(-). Denomina-se, portanto, saída 
a solução da equação (2.2) associada a uma entrada e condições iniciais específicas. 
Para, cada conjunto formado por uma função de entrada e condições iniciais (cujo 
número é igual à ordem da equação), uma única função de saída é determinada pois, 
nestas condições, (2.2) admite uma e apenas uma solução. 

Nosso interesse ganha maior amplitude quando a equação diferencial ou a diferen- 
ças finitas dada em (2.2) representar o modelo matemático, mesmo que simplificado, 
de um processo ou sistema dinâmico que se quer estudar ou, no presente caso, 
controlar. Neste contexto, assim enunciamos os objetivos a serem atingidos: 


B Gi a a e ~ o 
Determinar uma função de entrada g(-) para que o sistema em estudo se com- 
DOT = ) ° e ° o 2 e ma 
; te de uma maneira adequada, definida a priori, através de especificações 
e projeto que podem envolver o seu comportamento durante o transitório, o 
seu comportamento em regime permanente, a supressão de ruídos e apresente 
margens seguras de estabilidade. 
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Em seguida, discutimos esses objetivos que são comuns a qualquer projeto de 
sistema de controle. As várias implicações e dificuldades teóricas a serem enfrentadas 
são explicitadas para que se possa conseguir um procedimento viável de projeto a 
ser adotado no âmbito de controle de sistemas dinâmicos, tendo em vista aplicações 
práticas de interesse. 


2.2.1 Perspectivas 


Para colocarmos os objetivos anteriormente enunciados dentro de um contexto 
adequado é preciso ficar claro o significado da relação (2.2). Ela pode ser vista como 
uma regra que identifica pares de funções (g(:), y(:)) que a satisfaz. Normalmente, 
dada uma função g(:) deseja-se determinar o outro elemento do par, isto é, a função 
y(). Para obtê-la, temos que resolver a equação D[y| = g, onde g(:) é dada e y(:) 
é a incógnita. Inversamente, se y(:) for dada não há dificuldade alguma para se 
determinar o outro elemento do par através do cálculo de g = Dly]. 

Portanto, se o comportamento desejado de um determinando sistema dinâmico 
for traduzido por uma função de saída ypar(:) eleita como paradigma, não se teria 
nenhuma dificuldade em fazer com que o sistema, assim, se comportasse através 
da adoção da função de entrada gpar = DlIypar|. Como vimos anteriormente, essa 
solução, denominada de malha aberta, por demais simples, não atende aos seguintes 
aspectos relevantes de um bom projeto, que passamos a discutir: 


e Modelo matemático. Um modelo matemático que seja mais preciso possível 
e, simultaneamente, o mais simples possível é fundamental para que as carac- 
terísticas relevantes do sistema em estudo sejam levadas em conta no projeto. 
É importante notar que o projeto se faz com o modelo matemático, mas o que 
se deseja é controlar o sistema real. 


e Parâmetros. Modelos matemáticos dependem de parâmetros que devem ser 
obtidos (em alguns casos através de ensaios), tornando explícitas as precisões 
envolvidas. É preciso levar em consideração que, ao trabalhar com os valores 
nominais, estamos apenas adotando um modelo aproximado da realidade. 


e Condições iniciais. Geralmente, as condições iniciais não precisam ser ex- 
plicitadas. Para modelos lineares, um bom projeto de controle deve ser bom 
para qualquer condição inicial. 


e Estabilidade. Este sempre será um dos atributos básicos exigidos em qual- 
quer projeto de controle. Ademais, para sistemas estáveis, o efeito das condi- 
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Figura 2.2: Estrutura de controle em malha fechada 


ções iniciais desaparece no decorrer do tempo. Assim sendo, elas só têm im- 
portância durante o transitório. 


e Fatores não modelados. É preciso levar em conta a existência de imprecisões 
e de fatores não modelados - ruídos - que acabam influenciando o desempenho. 
Neste sentido, devemos impor certa robustez ao resultado de um projeto de 
controle, como forma de levar em conta a existência de diferenças entre sistemas 
reais e seus respectivos modelos. 


Uma das maneiras mais adequadas de levar em conta essas importantes carac- 
terísticas nos projetos de sistemas de controle é impor uma estrutura em malha 
fechada a qual, como já dissemos, será objeto de atenção central neste livro. Em 
linhas gerais, define-se um sinal de referência r que expressa o paradigma. Em cada 
instante de tempo, determina-se o sinal de erro e = r — y e define-se o sinal de 
entrada na forma g = C(e), onde C é um operador diferencial ou a diferenças finitas 
que deve ser projetado. À Figura 2.2 ilustra esta estrutura. 


De fato, trata-se de um diagrama onde o fluxo de informações definido pelos 
ramos e as operações definidas pelos blocos estão explicitadas. Esse diagrama é 
denominado diagrama de blocos e pode ser apresentado tanto no domínio do tempo 
(contínuo ou discreto) como no domínio das transformadas (Laplace ou Z). É claro 
que, em cada um desses domínios, é imperativo realizar as operações adequadas para 
obter a saída em função da entrada de cada bloco. 


Pe ° o é / é = t / e o 

O objetivo deste livro é de introduzir métodos e procedimentos para projetar 
o bloco C da Figura 2.2, denominado controlador, de tal forma que o sistema em 
malha fechada apresente um desempenho que atenda certos critérios previamente 


SE e ~ . . e o . 
estabelecidos. Para melhor compreensão, discutimos a seguir, dois exemplos ilustra- 
tivos. 
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Je, b 


Figura 2.3: Motor de corrente contínua 
2.2.2 Motor de Corrente Contínua 


A Figura 2.3 mostra o modelo bem conhecido de um motor de corrente contínua 
com o qual se deseja movimentar uma carga com momento de inércia Je através 
de um eixo com coeficiente de atrito viscoso torcional b. O rotor tem momento de 
inércia Jm. A carga é movimentada através de duas engrenagens com raios Tm € 
re, respectivamente. O objetivo é fazer com que a carga se movimente com uma 
velocidade angular constante Vperm pré-estabelecida e que não dependa das suas 
características específicas, isto é, dos parâmetros Ją eb. O rotor, constituído por 
um conjunto de espiras, é modelado por um circuito RL série alimentado pela tensão 
externa V. Na mesma figura mostramos as forças tangenciais nas engrenagens. 

Em relação aos referenciais indicados, o seguinte modelo matemático rege o com- 
portamento dinâmico do motor: 


e Parte Elétrica. O circuito RL série fornece 
d d 
L—i + Ri = V — K — > 
m + Ri Y (2.3) 
onde se nota o acoplamento através da velocidade angular do rotor. 


e Parte Mecânica. O motor gera um torque total Trot = Ki, que é transferido 
à carga através do rotor. Portanto, obtemos as equações 
d? de 


d 
Ima? + Frm = Tiot , Jea? T T = Er (2.4) 
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as quais, levando em conta as relações algébricas rnb = Td e c = re ra 
permitem determinar O deslocamento angular da carga na forma 

d? d | 

TEM a b70 = Citi (2.5) 


onde se nota o acoplamento através da corrente elétrica que circula no rotor. 


(Je + Im?) 


A velocidade angular da carga v(t) = O(t) deve ser controlada através da tensão 
de entrada V(t) aplicada no rotor. O objetivo, portanto, é determinar V(t), para 
todo t > 0, de tal forma que a velocidade angular da carga em regime permanente 
possa Ser especificada independentemente dos seus parâmetros físicos. 

Sob condições iniciais nulas, aplicando a transformada de Laplace em (2.3) e 
(2.5), obtemos 


AN 


(Ls+Rji+cKô = V 
(Jet Jme)s+b) ô = cKi 


onde já foi utilizada a relação v = sô. Substituindo na segunda equação a transfor- 
mada de Laplace da corrente fornecida pela primeira equação, obtemos a função de 
transferência entre a tensão de entrada V e a velocidade angular da carga É, ou seja 
ô = G(s)V, na forma 


cK 
((Je + Jme)s + b)(Ls + R) + eK? 


Esta função de transferência admite duas importantes conclusões: Em primeiro 
lugar, trata-se de uma função de transferência com dois polos e nenhum zero. Em 
segundo lugar, como todos os coeficientes da sua equação caracteristica 


G(s) = (2.8) 


(Jt Ine FI Ls rRe K =0 (2.9) 


são positivos ela admite duas raízes com parte real negativa. Em outras palavras, 
o sistema dinâmico em estudo é sempre assintoticamente estável, para quaisquer 
valores específicos de seus parâmetros. Portanto, para a entrada em degrau V (s) = 
Vo/ s, onde Vo é uma tensão constante, o teorema do valor final se aplica e fornece a 
velocidade angular da carga em regime permanente 


o cK 
Vperm = PERTO COR Vo 


a qual, como notamos, depende de vários parâmetros do motor e da carga. O 
próximo exemplo coloca em evidência um aspecto importante a ser bem entendido. 


(2.10) 
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v(t) [rad/s] 


Figura 2.4: Velocidade angular da carga 


Exemplo 2.1 A determinação dos valores nominais dos parâmetros de um motor e de 
uma carga específica fornece a função de transferência 


1 


e 
(8) = 4 sa? 


sendo que, neste caso, o valor nominal do coeficiente de atrito viscoso torcional é b = 
1,0 [Nms/rad). E interessante notar que, a partir da função de transferência G(s), podemos 
obter o modelo do motor no domínio do tempo, isto é 


14i(t) + 150(t) + 2v(t) = V (t) 


que é expresso na forma D[v| = V, onde D[v| é um operador diferencial de segunda ordem. 
Portanto, se desejarmos que a velocidade angular em regime permanente seja 50 [rad/s], 
basta aplicar uma tensão constante V(t) = Vo = 100 [V], V t > 0. Entretanto, se aplicarmos 
a mesma tensão constante em situações em que o atrito viscoso é ligeiramente diferente do 
nominal (note que o coeficiente b depende de vários fatores, inclusive ambientais), verificamos 
que a velocidade angular da carga, em regime permanente, muda. A Figura 2.4 ilustra esta 
afirmação para três valores diversos do coeficiente de atrito, sendo que o gráfico em linha 
contínua corresponde ao valor nominal b = 1,0 [Nms/rad]. Para manter a velocidade no valor 
desejado de 50 [rad/s], seria necessário determinar o valor exato do coeficiente de atrito b. 
Como já comentado anteriormente, concluímos que esta é uma estrutura de controle em 
malha aberta. o 


Exemplo 2.2 O mesmo modelo do motor de corrente contínua, tratado no exemplo an- 
terior, é novamente considerado. Porém, no presente caso, implementamos a estrutura de 
controle em malha fechada descrita na Figura 2.2. Nesse sentido, a partir do sinal de re- 
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v(t) [rad/s] 


Figura 2.5: Velocidade angular da carga 


ferência r(t) = 50, Vt > 0, a tensão de entrada é dada por 
t 
A= 0,25 | e(T)dr , t>0 
0 


onde e(t) = r(t) — v(t) é o erro entre a referência (o valor da velocidade angular da carga 
em regime permanente) e a velocidade da carga em um instante de tempo t > 0 genérico. É 
interessante observar que aplicando a transformada de Laplace na equação acima obtemos 
V = (0,25/s)ê, o que mostra que a função de transferência do controlador é C(s) = 0,25/s. 
Este controlador fornece um sinal proporcional à integral do erro, cujo ganho foi determinado 
para assegurar a estabilidade do sistema em malha fechada. A Figura 2.5, obtida sob as 
mesmas condições da Figura 2.4, mostra que variando o valor do coeficiente de atrito viscoso 
a velocidade em regime permanente da carga se mantém no valor desejado. Observe que, 
como consequência da variação de b, o transitório se modifica. oO 


Esse exemplo coloca em evidência, mais uma vez, que a estrutura de controle 
em malha fechada permite um desempenho superior quando comparada com a es- 
trutura de controle em malha aberta. O motivo central para que isto ocorra é que, 
no primeiro caso, a implementação da lei de controle exige que a variável a ser con- 
trolada (no caso, a velocidade angular da carga) seja medida em todo instante de 
tempo t > 0. Em princípio, a estratégia é fazer com que erro entre o que se deseja e 
o seu valor real seja reduzido no decorrer do tempo. Na verdade, manipular apenas 
o valor instantâneo do erro pode não ser suficiente para se projetar um bom sistema 
de controle. Em muitos casos um controlador C (s), com uma dinâmica própria, pre- 
cisa ser adotado para atender as exigências do projeto. Outros aspectos, igualmente 
importantes, sao analisados através do próximo exemplo. 
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Figura 2.6: Pêndulo invertido 


2.2.3 Pêndulo Invertido 


A Figura 2.6 mostra um pêndulo invertido com massa m e comprimento £ mon- 
tado sobre um carro com massa M. O sistema está imerso em um meio isento de 
atrito. Deseja-se levantar o pêndulo para a posição vertical do = +90º, movimen- 
tando o carro através da aplicação da força horizontal F. Com o pêndulo posicionado 
na posição vertical, o carro deve estar na sua posição original x = 0. A mesma figura 
coloca em evidência o diagrama de forças que permite estabelece o seguinte modelo 
matemático para o deslocamento do carro e do pêndulo. 


e Deslocamento horizontal do carro. Sendo x o deslocamento horizontal do 
carro, segundo o referencial inercial adotado, temos 
d? 


Mar = Tcos(ġ) + F (2.11) 


e Deslocamento horizontal do pêndulo. Sendo z + Zcos(ġ) a posição hori- 
zontal do pêndulo, segundo o mesmo referencial, vem 


2 
mesa + Lcos(4)) + Tcos(d) = 0 (2.12) 


e Deslocamento vertical do pêndulo. Finalmente, sendo Zsen(ġ) a posição 
vertical do pêndulo, obtemos 


2 
ms (tsen(d) + Tsen(d) +mg =0 (2:13) 
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Estas equações podem ser simplificadas ao eliminarmos a força de tração no fio 
T. sobre a qual não recai nosso interesse. As duas primeiras equações permitem 


re-escrever o deslocamento horizontal do carro na forma 


(M + mm) — misen(P)b — mtcos(d)4? = F (2.14) 


enquanto que a equação (2.12) multiplicada por —sen($) adicionada à equação (2.13) 
multiplicada por cos($) fornece 


td — sen(p) + gcos(b) = 0 (2.15) 


Portanto, os deslocamentos do carro e do pêndulo, sob a ação da força externa F, 
são descritos por um modelo matemático composto por duas equação diferenciais 
não lineares de segunda ordem acopladas. Dadas as condições iniciais de posição e 
velocidade do carro e do pêndulo, bem como a força F que atua no carro, o sistema 
de equações diferenciais (2.14)-(2.15) ao ser resolvido, fornece o movimento do carro 
e do pêndulo no decorrer do tempo. Tendo em vista a sua natureza não linear, 
esse sistema de equações diferenciais só pode ser resolvido numericamente, fazendo 
com que a determinação de uma força F, que atenda os requisitos de projeto, seja 
bastante difícil. A estrutura de controle em malha fechada torna possível a realização 
do controle com as características desejadas. 

Inicialmente, vamos determinar um modelo linear simplificado, válido em uma 
vizinhança do ponto de interesse (xo, o) = (0, +90º). Definido o deslocamento 
do pêndulo medido a partir da vertical, ou seja O(t) = d(t) — do e lembrando as 
aproximações de primeira ordem fornecidas pela série de Taylor para cos(d) = —0 e 
sen(ġ) % 1, as equações diferenciais (2.14)-(2.15) são aproximadas por 


(M +mi-mto = F (2.16) 
0-z—-9g) = 0 (2.17) 


Como era de se esperar, esse sistema dinâmico é instável. De fato, se em t = 0 o 
pêndulo estiver ligeiramente fora da posição vertical, e o carro for mantido parado, 
o pêndulo cai. Este comportamento é previsto pela equação (2.17) com ț = 0. 


Exemplo 2.3 Consideramos um sistema caracterizado pelos seguintes dados numéricos 
M = 10,0 [kg], m = 20 [kg], £ = 1,0 |m] e g = 9,8 [m/s?. Supondo que em t = 00 
pêndulo esteja fora da vertical, o objetivo é determinar a força F de tal forma que em 
regime permanente tenhamos (x, ,0,0) = (0,0,0,0). Ou seja, o carro para em x = 0 
com o pêndulo parado na posição vertical 6 = O. Novamente, implementamos a estrutura 
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0 5 10 15 


Figura 2.7: Simulação do pêndulo invertido 


de controle em malha fechada assumindo que podemos medir, em cada instante de tempo 
t > 0, as grandezas (x(t), x(t), O(t), O(t)). Por tentativa e erro determinamos 


F(t) = 10x(t) + 50%(t) — 3006(t) — 1000(t) 


como sendo um controle adequado. É interessante observar que desde o início assumimos 
que o pêndulo e o carro estão em um ambiente desprovido de atrito. Por consequência, nas 
equações (2.16)-(2.17) não aparece explicitamente a velocidade linear do carro e a velocidade 
angular do pêndulo. Ao depender dessas quantidades, a lei de controle funciona como se 
algum tipo de atrito viscoso fosse introduzido entre o carro, o pêndulo e o meio onde eles se 
movimentam. A Figura 2.7 mostra a simulação do carro e do pêndulo partindo do repouso 
em t = 0 nas posições x = 0 |m] e q = 7/4 [rad], respectivamente. A lei de controle proposta 
é efetiva para equilibrar o pêndulo na posição vertical e fazer o carro retornar à origem do 
sistema de referência. Devemos salientar que o controle foi projetado a partir do sistema 
linearizado que é apenas uma aproximação do sistema real não linear. O seu desempenho, 
frente ao sistema real, deve ser objeto de validação a posteriori para colocar em evidência 
as suas limitações. a 


Esperamos ter ilustrado, através de alguns exemplos retirados da vida real, que 
a estrutura denominada controle em malha fechada ou controle com realimentação 
é a mais adequada para ser adotada no projeto de controle de sistemas dinâmicos. 
Em seguida, passamos a estudar os seus mais variados aspectos e propriedades para 
podermos projetar controladores em um contexto bastante geral tendo em vista, 
sobretudo, possíveis aplicações práticas de importância no mundo real. 


Qo 
fa 


SISTEMAS DE CONTROLE COM REALIMEN TAÇÃO 


&> 


Figura 2.8: Estrutura de controle com realimentação 


2.3 Sistemas de Controle com Realimentação 


A estrutura básica de um sistema de controle com realimentação ou sistema de 
controle em malha fechada é dada na Figura 2.8. Trata-se de um diagrama a blocos 
que representa um sistema linear invariante no tempo, onde cada DIDO E definido 
por uma relação entrada / saída. Duas descrições equivalentes são possíveis, a saber: 
no domínio do tempo ou no domínio da frequência. No primeiro caso, cada bloco é 
definido pela sua resposta ao impulso unitário e, por conseguinte, a sua saída é dada 
pela convolução da entrada pela sua resposta ao impulso. No segundo caso, cada 
bloco é definido por sua função de transferência, que nada mais é que a transformada 
de Laplace (tempo contínuo) ou a transformada Z (tempo discreto) de sua resposta 
ao impulso unitário. Assim sendo, a sua saída é dada pelo produto da transformada 
da função de entrada pela função de transferência. 

Deve ser observado que assim procedendo, estamos tratando indistintamente os 
sistemas a tempo contínuo e os sistemas a tempo discreto. Entretanto, na prática, 
como aliás ocorre nos exemplos já tratados, geralmente os sistemas dinâmicos são 
sistemas a tempo contínuo havendo interesse de que a implementação de um deter- 
minado controlador seja feita por meio digital, ou seja, em tempo discreto. Este 
importante aspecto será objeto de estudo a ser realizado mais adiante. 


2.3.1 Estrutura Básica 


É preciso entender todos os elementos da estrutura básica de controle dada na 
Figura 2.8, pois ela será o objeto principal de estudo até o final deste livro. Deste 
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ponto em diante, assumimos que o diagrama de blocos da Figura 2.8 representa 
um sistema a tempo contínuo. Na verdade, será o controlador definido pela função 
de transferência C(s) que receberá a atenção principal, tendo em vista que é ele 
que deve ser projetado, para impor ao sistema em malha fechada um determinado 
desempenho previamente estabelecido. Em relação aquele diagrama de blocos, as 
seguintes considerações são pertinentes: 


e O sinal r é chamado sinal de referência e representa o paradigma de projeto. 
Assim sendo, em um bom sistema de controle, após um período de tempo 
(transitório) a saída controlada do sistema em malha fechada deve se aproximar 
do sinal de referência. 


e Os sinais w e v definem perturbações externas não modeladas. Tipicamente, 
o sinal w representa perturbações que atuam na mesma faixa de frequência 
que o sinal de referência. O sinal v representa um ruído de alta frequência 
introduzido pelo dispositivo de medida. 


e O sinal y é a saída a ser controlada. O objetivo é fazer com que, em alguma 
métrica, o erro £ = r — y seja o menor possível. Note que e e £ são grandezas 
distintas. 


e H(s) é a função de transferência do dispositivo que mede y. Um bom medidor 


Sa : o ; ; 
é caracterizado por um mero ganho estático, aqui normalizado em H (s) ~ 1. 


e G(s) é a função de transferência em malha aberta do sistema que se deseja 
controlar, isto é 


y = G(s) (2.18) 


e C(s) é a função de transferência do controlador que se quer projetar. O obje- 
tivo é cumprir as especificações de transitório e de regime permanente de tal 
forma que £ > 0. 


A estrutura básica dada na Figura 2.8 é bastante geral para os nossos propósitos 
mas não é a mais abrangente possível. Por exemplo, a possibilidade de tratarmos 
sistemas com imprecisões paramétricas não está contemplada. Este e outros casos 
“de real interesse prático serão discutidos oportunamente. 

Entretanto, um caso particular importante deve ser desde logo considerado. 
Trata-se da chamada realimentação unitária, caracterizada por H(s) = 1, que é 
obtida quando o medidor é considerado ideal. Na prática, essa hipótese é bas- 
tante realista como consequência da qualidade crescente dos dispositivos de medida 
disponíveis. Por este motivo assumimos que H(s) = 1. 
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2.3.2 Função de Transferência em Malha Fechada 


A partir do diagrama de blocos da Figura 2.8, adotando a descrição no domínio 
da frequência para cada bloco e aplicando a transformada de Laplace, obtemos as 


seguinte relações 


y = G(s)(W + C(s)ê) (2.19) 
ê = f—H(s\(ĝ +ô (2.20) 
com as quais, substituindo (2.20) em (2.19), obtemos 
CG G CG 
ea TI Pa 221 
eco e [HCO (2.21) 


onde é importante salientar que as três parcelas têm o mesmo denominador, o qual 
depende da função de transferência C(s) que se deseja projetar. A relação acima, 
mostra como a saída é influenciada pelo sinal de referência f e pelos ruídos w e d. 
Para é = 0 e à = 0 obtemos ġ = F(s)”? onde 


C(s)G(s) 


ANDST 


(2.22) 
é denominada função de transferência em malha fechada. Assumindo que as funções 
C(s) e G(s) sejam racionais, o mesmo ocorre com a função F(s), cujo comportamento 
temporal depende sobremaneira de seus polos que são as raízes de 


1+ C(sS)G(s) =0 (2.23) 


Cd 


denominada equação característica do sistema em malha fechada. E claro que se 
todas as suas raízes estiverem localizadas no semiplano esquerdo complexo, o sistema 
em malha fechada será assintoticamente estável. Mencionamos mais uma vez que 
dada a função G(s), os polos de F(s) podem ser alterados através de uma escolha 
conveniente da função de transferência C(s). 


Exemplo 2.4 O motor de corrente contínua tratado no Exemplo 2.2 pode ser colocado 
na forma do diagrama de blocos da Figura 2.8 com ù = v = 0 e 


1 
= — C = 
1482 + 15s +2’ (E 


onde p = 0,25. A função de transferência em malha fecha é imediatamente calculada como 
sendo 


G(s) 


p 
Rss SAE ER 
Junan DE 
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bem como seus polos, raízes da equação característica 148º + 158º + 2s + p = 0. Podemos 
verificar numericamente que as três raízes têm parte real negativa desde que O < p < 15/7. 
Para p = 0,25 os seus polos são [—0,9396; —0,0659 + 50,1211 +. 0 


Exemplo 2.5 O sistema de controle em malha fechada do pêndulo invertido tratado no 
Exemplo 2.3 pode ser re-escrito na forma 


12%—20 = 10g + 50% — 3006 — 1008 
0— ë 9,80 


cuja transformada de Laplace, sob as condições iniciais anteriormente consideradas, fornece 


1252 — 50s — 10 —252 + 100s + 300 | | ê | o | st/2 — 257 | 


—s? s? — 9,8 ô —sT/4 


Portanto, o polinômio característico do sistema em malha fechada é dado pelo determinante 
da matriz acima indicada, ou seja 


105s + 508º + 172,408? + 490s + 98 = 0 


cujas raízes são {—3,7174; —0,5336 + 93,4580; —0,2153+. Embora o sistema em malha aberta 
seja instável, pois sua equação característica é 10st — 117,6s? = 0, o sistema em malha 
fechada é assintoticamente estável. Isso é necessário para assegurar que os atributos do 
projeto possam ser alcançados, ou seja, posicionar o pêndulo na vertical e o carro na origem 
do sistema de referência. o 


De maneira geral, o projeto de um controlador é feito sob a hipótese de que os 
sinais w e é são nulos, ou seja, sob a hipótese de que o sistema em malha fechada não 
está sujeito a perturbações ou ruídos externos. Portanto, uma vez que o controlador 
com função de transferência C(s) tenha sido determinado, é imperativo validar o 
seu desempenho sob condições reais, ou seja, sob a ação de perturbações externas 
não modeladas e possível variação dos parâmetros em uma vizinhança dos valores 
nominais utilizados. 


2.3.3 Sensibilidade 


O estudo de sensibilidade é importante para o projeto de sistemas de controle. 
Para melhor entendimento, vamos considerar inicialmente um caso bastante simples, 
isto é, um sistema de controle em malha aberta com função de transferência G(s) 
de tal forma que y = G(s)j. Considerando que G(s) não seja exatamente conhecida 
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mas que possa variar para G(s) + AG(s), a saída correspondente seria ý + Ay, onde 
Ag = AG(s)9. Portanto, definindo a função de sensibilidade como sendo 


S(s) = — 2918 


~ AG(S)/G(S) de 


obtemos imediatamente S(s) = 1. Ou seja, uma variação percentual da função de 
transferência em relação ao seu valor nominal reflete-se integralmente na variação 
da saída em relação ao seu valor nominal. Passando ao limite, podemos determinar 
a sensibilidade através de simples derivação, na forma 


di G d(lnĝ) 
S(s) = | — no EOS ; 
o= (36) (5) = T8 em 
Sem dificuldades, aplicamos este mesmo conceito no sistema em malha fechada 
dado por ĝ = F(s)? onde F(s) é fornecida em (2.22). Obtemos 


dy dF . 
do de 
= C a 
que substituída em (2.25), leva ao resultado final 
l 
S(s) (2.27) 


“IEC 


Essa função de sensibilidade é muito diferente daquela obtida para o sistema em 
malha aberta. Nesse caso, ela depende da função de transferência do controlador 
C(s), a qual, em princípio, pode ser determinada de tal forma que a função de sen- 
sibilidade assuma somente valores muito menores do que um. Assim procedendo, o 
sistema em malha fechada torna-se pouco sensível às variações na função de trans- 
ferência em malha aberta. É preciso ficar claro o significado da função de sensibili- 
dade S(s). Considerando que G(s) seja alterada para G(s) + AG(s), isso faz com 
que a saída se altere aproximadamente para ĝ + Ag, onde 


Ay ; AG(s) 
7 — S(s) G(s) (2.28) 


a transformada inversa de Laplace de S(s) fornece um ganho, variante no tempo, que 
permite determinar a variação temporal da saída Ay(t) associada a uma variação 
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na função de transferência em malha aberta. De forma análoga o mesmo resultado 
pode ser interpretado no domínio da frequência. De fato, S(jw) é o ganho em cada 
frequência que determina Ag(jw) a partir de AG(gw). 

O estudo de sensibilidade torna-se bastante importante, na medida em que uma 
interpretação adicional pode ser dada. Mais uma vez, considerando o sistema em 
malha fechada da Figura 2.8, com a relação (2.21) obtemos o erro ê = f — y entre o 
sinal de referência e o sinal de saída, como sendo 


1 CG 
Ce E TEn, 2.2 
qdo puro ai 
o qual pode ser re-escrito na forma 
ê = S(s)(r — G(s) + T(s)ô (2.30) 
onde T(s) é a chamada função de sensibilidade complementar, dada por 
C(s)G(s) 
A ES 2.31 
POET OOO pm 


Nesse ponto, dois aspectos devem ser ressaltados: O primeiro é que os domínios 
das funções S(s) e T(s) são os mesmos pois ambas têm os mesmos denominadores 
e, por consequência, os mesmos polos. Para todo s € C dos seus domínios, tem- 
se S (s) + T(s) = 1, ficando evidente que não podemos reduzir simultancamente 
ambas as funções. Para diminuir uma delas, paga-se o preço de ter, necessariamente, 
que aumentar a outra. O segundo é que as funções de sensibilidade e sensibilidade 
complementar se relacionam com a função de transferência em malha fechada através 


de S(s) = 1 — F(s) e T(s) = F(s). 
Exemplo 2.6 Para o motor de corrente contínua tratado no Exemplo 2.4 temos 


148º + 1582 + 23 0,25 


Sls) = — ~ Ü, T(S)=— [5 —TO——— 
(8) 148º + 15582 +25 + 0,25 (5) 145º + 158? + 25 + 0,25 


A Figura 2.9 mostra os módulos da função de sensibilidade |S(jw)| e da função de sensibili- 
dade complementar|T (jw)| expressos em dB. Deve-se observar que |S(jw)| < 1 para baixas 
frequências e que |T(jw)| < 1 para altas frequências. Este é um comportamento típico 
destas funções. o 


A equação (2.30) é muito importante e merece ser analisada com maiores deta- 
lhes. Geralmente, é possível estabelecer um valor de frequência we de tal forma que o 
ruído |ô(jw)| seja significativo apenas para w > we e o sinal de referência |F (jw)| e a 
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w [rad/s] 


Figura 2.9: Funções de sensibilidade e sensibilidade complementar 


perturbação externa [W(jw)| sejam significativos apenas para w < we. Sabemos que 
não é possível fazer |S(jw)| < 1 e |T(jw)| < 1 simultaneamente, entretanto, como 
foi feito no Exemplo 2.6, podemos perfeitamente fazer |S(jw)|) < 1 para w < we € 
IT (jw)| < 1 para w > we. Assim procedendo, a relação (2.30) permite concluir que 
o módulo do erro |ê(jw)| será pequeno Yw € R. Ou seja, o erro entre a referência e a 
saída permanecerá limitado em toda a faixa de frequências mesmo sob a ocorrência 
de perturbações externas e ruídos de medição. | 


2.3.4 Critérios de Desempenho 


Nosso objetivo, nesta seção, é explicitar alguns critérios que permitam carac- 
terizar comportamentos adequados para sistemas de controle em malha fechada. 
Considerando a estrutura de controle em malha fechada estudada anteriormente 
com w = ò = 0, introduzimos os seguintes critérios a serem atendidos pela escolha 
adequada de um determinado controlador com função de transferência C(s): 


1. O sistema em malha fechada deve ser assintoticamente estável e seguir com 
erro nulo um degrau unitário. 


2. Para condições iniciais nulas, sua resposta ao degrau unitário deve obedecer o 
perfil dado na Figura 2.10, definido pelos parâmetros (Yp, €, te). 


As especificações acima definem o comportamento adequado do sistema para uma 
entrada particular, no caso, o degrau unitário. Especifica-se o seu comportamento 
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te t 
Figura 2.10: Perfil para resposta ao degrau 


durante o transitório e em regime permanente. De fato, estes critérios exigem que 
e(t) = r(t) — y(t) tenda para zero quando t — -+oo e que |e(t)| < € para todo t > te. 
Em adição, o valor de pico da saída, medido em relação à entrada, não pode exceder 
o valor pp estipulado. 

Neste ponto devemos nos perguntar se é possível traduzir esses critérios, que 
dependem da resposta temporal y(t) do sistema, em condições sobre a sua função 
de transferência F(s). A resposta é afirmativa e, como veremos a seguir, eles se 
traduzem em impor o valor de F(s) para s = 0, bem como a localização dos seus 
polos no interior de uma região específica 9) do plano complexo. 

Lembrando que y = F(s)r e ? = 1/s, como pelo primeiro critério, o sistema deve 
ser assintoticamente estável, o teorema do valor final fornece 


im elt) = lim (1 — F(s))sf 
= 1-F(0) (202) 


Assim sendo, o primeiro critério é atendido sempre que os polos de F(s) estejam 
localizados no interior do semiplano esquerdo e F(0) = 1. 

O estudo do segundo critério é feito através da chamada aproximação de polos 
dominantes, a qual requer que a função de transferência em malha fechada F(s) seja 
decomposta na forma 


F(s) = Fap(s) + Q(s) (2.33) 


onde os polos das duas parcelas Fap(s) e Q(s) constituem dois conjuntos disjuntos. 
Isto é, existe d > 0 tal que os polos de Fap(s) satisfazem —d < Re(s) < 0 e os polos 
de Q(s) satisfazem Re(s) < —d. Neste caso, os polos ditos dominantes de F(s) são 
retidos em Fap(s). Ademais, na transformada inversa de F(s), os termos devidos aos 
polos dominantes permanecem enquanto que os demais desaparecem no decorrer do 
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tempo. Assim sendo, após um curto intervalo de tempo, o efeito de Q(s) em F(s) 
desaparece, o que permite que a aproximação F (s) ~ Fap(s) seja adotada. 

Vamos considerar os dois casos mais simples e de maior interesse. Inicialmente, 
consideramos que F (s) apresenta um único polo dominante, ou seja 


o 
s+Ho 


Fapls) = (2.34) 
que é assintoticamente estável desde que o > 0 e Fop(0) = 1. Sua resposta ao degrau 
unitário sendo dada por 

nele (2.35) 


permite concluir que o perfil da Figura 2.10, definido por (Yp, €, te), é atendido desde 
que o > cc = —lIn(e)/te > 0. Em conclusão, se F(s) admite um polo real dominante 
então um perfil dado será atendido desde que os polos de F(s) estejam localizados 
na região Re(s) < —oc < 0. 

Consideramos agora um outro caso importante em que dois polos complexos 
conjugados são dominantes, ou seja 


(2 


n (2.36) 


F = — | 
ap(s) s2 + 2Ewns + w2 


onde0< é < 1 éo fator de amortecimento, wn é a frequência natural não amortecida 
e wq é a frequência natural amortecida. Trata-se de uma função de transferência 
assintoticamente estável com polos s = —ø + jwa onde o = Eunewg=wnv1l — £? e 
que satisfaz a condição Fap(0) = 1. Sem dificuldades podemos determinar a resposta 
associada à entrada degrau unitário r(t) = 1, Vt > 0, ou seja 


ut) =1-e* (cosut) + Sr sen (wat) ) 23N) 
d 


a qual permite explicitar duas características principais, a saber: 


e Valor de pico máximo : Simples derivação em relação ao tempo mostra 
que y(t) = O desde que sen(wat) = O. Portanto, o máximo de y(t) ocorre em 
t = T/wa € Mmaxt>o y(t) = 1+Y(£) onde 


WEE TAE (2.38) 


Como y%(£) é uma função decrescente, o seu valor máximo é %(0) = 1 e ela 
tende para zero quando o fator de amortecimento tende para um. Portanto, 
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Figura 2.11: O conjunto Q 


determinando &,, tal que W(£,) = Yp, concluímos que para todo é > & > 0 
a desigualdade (é) < yp é satisfeita. Em outros termos, qualquer fator de 
amortecimento maior ou igual a p assegura que o pico máximo de y(t), medido 
em relação à entrada, não ultrapassa pp. 


e Tempo de estabilização : (Como os pontos de máximo e mínimo locais 
de y(t) ocorrem em instantes de tempo tais que sen(wyt) = 0, então com 
(2.37) verificamos que eles se localizam sobre as funções 1 +e tel — e7%, 

respectivamente. Portanto, a condição o > oc. = —In(o)/te > O assegura, 

aproximadamente, que |e(t)| < e para Vt > te. 


Dado um perfil temporal da resposta ao degrau unitário definido pelos parâmetros 
(Wp, €, te), determinamos o par (£p, oe) através de W(ép) = Wp e ce = —In(e)/te bem 
como o conjunto Q C C ilustrado na Figura 2.11 que, como vemos, é um sub-conjunto 
inteiramente contido no semiplano esquerdo complexo. 

Pelos cálculos realizados, podemos afirmar que se o polo s € R de uma função 
de transferência de primeira ordem estiver no interior de Q então Re(s) < —oc o que 
faz com que o perfil temporal seja atendido. Da mesma forma, se os polos complexos 
conjugados de uma função de transferência de segunda ordem estiverem no interior 
de Q então o = |Re(s)| > ce, é = |Re(s)|/|s| > Ep e, novamente, o perfil temporal é 
“atendido. Os exemplos dados a seguir ilustram alguns aspectos desses resultados. 


Exemplo 2.7 Considere que o perfil da resposta temporal ao degrau unitário seja definido 
por (bp, este) = (0,2; 0,05; 10,0). Isso indica que a resposta ao degrau unitário pode ter 
uma sobre-elevação máxima de 20% e o módulo do erro entre a saída e a entrada deve 
ser menor do que 5%, transcorridos 10.0 [s]. Determinamos o. = —1n(0,05)/10 = 0,3 e 
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Figura 2.12: Resposta ao degrau unitário e o conjunto Q 


EE 0,455, que satisfaz )(£p) = 0,2. Com estes dois parâmetros, o conjunto Q da Figura 
2.11 é imediatamente determinado. 

A Figura 2.12 mostra à esquerda as respostas ao degrau unitário e o perfil temporal 
desejado e, à direita, os polos e o conjunto Q calculado para cinco funções de transferência 
de segunda ordem do tipo (2.36). Nota-se uma concordância com os resultados apresenta- 
dos. Funções com polos no interior de Q geram respostas temporais que obedecem o perfil 
e, inversamente, funções com polos no exterior de Q geram respostas temporais que não 
obedecem o mesmo perfil. | o 


Exemplo 2.8 É importante salientar que para a determinação do conjunto Q introduzi- 
mos uma aproximação para o tempo de estabilização fazendo com que ele dependesse exclu- 
sivamente do valor do parâmetro o. A resposta ao degrau unitário (2.37) pode ser escrita 


na forma alternativa ? 
— 0 


y(t) = 1 — o cos (wat — sen”! (€)) 


permitindo concluir que o > —In(«/1 — &2e)/t. assegura |e(t)| < € para todo t > te. Como 
esta relação depende explicitamente do fator de amortecimento, se tivesse sido usada, não 
resultaria em uma região no plano complexo tão simples quando aquela obtida anteriormente 
através do cálculo aproximado do tempo de estabilização. O 


O conjunto Q, associado a um determinado perfil da resposta ao degrau unitário, 
foi determinado para funções de transferência com apenas um ou dois polos. Para 
uma função de transferência qualquer F(s), o mesmo conjunto pode ser determinado 
desde que a aproximação de polos dominantes seja válida. Quando esta aproximação 
não é válida, não há como aproximar F(s) por funções de primeira ou de segunda or- 
dens sem que erros importantes sejam introduzidos na análise. Um maneira simples 
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de contornar esta dificuldade é impor que todos os polos de F(s) estejam localizados 
no interior de Q, o que resulta no seguinte critério de desempenho consolidado: To- 
dos os polos da função de transferência em malha fechada F(s), raízes da equação 
característica 1 + C(s)G(s) = O, devem estar localizados no interior de Q. 

Neste ponto, alguns comentários são pertinentes e devem ser levados em conta 
para a realização adequada de projetos específicos. Em primeiro lugar devemos mais 
uma vez enfatizar que a aproximação de polos dominantes, para ser precisa, neces- 
sita que os demais polos da função de transferência em estudo, estejam afastados - 
mais à esquerda - daqueles considerados dominantes. Quanto maior o afastamento 
(em termos da parte real dos polos) melhor será a aproximação. Em segundo lugar, 
a resposta ao degrau unitário de um sistema de controle em malha fechada assintoti- 
camente estável, com função de transferência F(s) com n polos distintos e F(0) = 1, 
pode ser decomposta via frações parciais na forma 


Pis (2.39) 


sendo que os valores numéricos dos parâmetros q1,:-- ,@n dependem de F(s) e, em 
particular, dos seus zeros e polos. Dessa forma, como era de se esperar, os zeros de 
F(s) alteram a contribuição dos polos dominantes em y(t). 

Mais à frente veremos alguns outros critérios de desempenho que também podem 
ser adotados para expressar um paradigma de projeto. Nesse sentido, podemos citar: 


e Margens de fase e de ganho. 
e Energia mínima. 


O primeiro é um critério que especifica margens, isto é, distâncias seguras, para 
que o sistema em malha fechada permaneça assintoticamente estável, sendo calcu- 
ladas através da resposta em frequência da função de transferência em malha aberta 
C(jw)G(jw). O segundo está associado à determinação da função de transferência 
C(s) de um controlador fazendo com que a quantidade 


ic / “a (2.40) 


seja mínima. Neste caso, determina-se um controlador que minimiza a energia con- 
tida no erro e(t) = r(t) — y(t) durante o período transitório. Como veremos, este 
procedimento de projeto é muito importante na medida em que, nos casos de in- 
teresse, o problema de minimização de J(C) em relação a C(s) pode ser resolvido 
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de maneira bastante simples do ponto de vista teórico e eficaz do ponto de vista 
numérico. Como J(C) finito, implica em que lim;-soo E(t) = 0, o controlador que 
minimiza J(C) assegura a estabilidade assintótica do sistema em malha fechada. 


2.4 Classes de Controladores e Discretização 


Nesta seção, o nosso objetivo é discutir dois aspectos de sistemas de controle 
que têm grande impacto na prática. O primeiro diz respeito a limitarmos nossos 
estudos a três classes de controladores, tendo em vista que são as mais importantes 
tanto do ponto de vista teórico como de implementação prática. O segundo trata 
da implementação digital de controladores a tempo contínuo. Nos dias atuais, este 
último aspecto ganha particular importância dada a disponibilidade, cada vez maior, 
de dispositivos digitais com maior capacidade de processamento, maior velocidade 
e maior capacidade de memória, com custos decrescentes. 


2.4.1 Classes de Controladores 


O projeto de sistemas de controle depende, como já vimos, de critérios que ex- 
plicitam determinados paradigmas que se tenta atingir através da escolha adequada 
da função de transferência do controlador C(s). Entretanto, na prática, critérios 
adicionais que envolvem custos e facilidade de implementação devem também ser 
levados em conta. Com esse propósito, no decorrer dos anos, foram adotadas três 
classes de controladores que estabeleceram padrões para a implementação de sis- 
temas de controle nos mais diversos ambientes industriais, a saber : 


e Controladores PID : Trata-se da sigla para os denominados controladores 
proporcional-integral-derivativo cuja função é transferência é dada por 


ki 
C(s) = kp + Ž + kas (2.41) 


onde kp > 0, k; > 0 e kg > 0 são parâmetros a determinar. Impondo-se alguns 
deles iguais a zero, obtém-se os controladores mais simples P, PI e PD. Como a 
sua função de transferência tem dois polos e apenas um zero, ela só é realizável 
de forma aproximada 


ki 
aaea a (2.42) 


s Ts+1 
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sendo que a constante de tempo T > 0 suficientemente pequena, deve ser ade- 
quadamente determinada. Observe que apenas os zeros de C(s) são deslocados 
no plano complexo a partir da escolha específica dos seu parâmetros. 


Geralmente, tratamos no dia-a-dia com sistemas dinâmicos a tempo contínuo. 
De fato, os sistemas físicos têm como variável independente o tempo t € R. São, 
portanto, classificados como sistemas a tempo contínuo e devem ser assim modelados. 
Como consequência natural, os projetos de controladores resultam na determinação 
de funções de transferência C(s) ou, de forma equivalente, das suas respectivas 
respostas ao impulso c(t) = L-H(C(s)). 

Entretanto, atualmente, com a disseminação de dispositivos digitais, ganha in- 
teresse a possibilidade de que a ação de controle se dê em tempo discreto. Ou seja, 
deseja-se implementar a lei de controle definida pela convolução 


Yet) = c(t)» e(t) 


= | ECO (2.47) 


e Controladores Atraso / Avanço : São aqueles com função de transferência 


da forma 
S+Z 


“s+p 
onde ke > 0, z > 0 ep > Osãoos parâmetros a determinar. Note que se 


p < z (p > z) a fase de C (jw) é sempre negativa (positiva), daí a denominação 
completa de atraso ou avanço de fase. 


Cheke (2.43) 


e Controladores de ordem completa : São os controladores cuja função 
de transferência tem a mesma ordem (isto é, o mesmo número de polos) que 
a do sistema em malha aberta. Geralmente a sua função de transferência é 


através de um dispositivo que opera em tempo discreto, resultando então o chamado 
expressa através da representação de estado 


controle digital. A partir das amostras de e(t) obtidas em t = kT com k E N, sendo 
T > 0 o período de amostragem, a saída ye(kT) é determinada e mantida constante 
até t = (k+1)T. Assim sendo, devemos determinar a função de transferência Cp(z) 
e a sua resposta ao impulso discreto co(kT) = Z"H(Cp(z)) de tal forma que a 
convolução discreta 


te = Aptos Bee (2.44) 
e Cetxe + Dee (2.45) 


Il 


onde (Ae, Be, Ce, De) são matrizes a determinar. A importância desta classe de 


controladores reside no fato dela ser a mais abrangente possível. Geralmente, : l YelkT) = cp(kT)ee(kT) 

nāo é possível melhorar o desempenho aumentando a ordem da função de : k 

transferência do controlador além da ordem da função de transferência do — = co(kT — iT'jeliT' (2.48) 

Ç — 
sistema em malha aberta G(s). — | i=0 
É preciso enfatizar que a classe dos controladores de ordem completa não só € | forneça os valores das amostras da saída do controlador. Existem diversas maneiras 
é a mais abrangente como é aquela que permite uma maior sistematização para a | de se obter Cola ) a partir de C(s), opaa RO Da a AEG a 
determinação das matrizes (Ae, Be, Ce, De) da representação de estado e, por con- | chamada função de transferência pulsada. Lembrando que a função de transferência 
sequência, da sua função de transferência € | do segurador de ordem zero (SOZ) é dada por 
l | dim asE 
C(s)=CsI-AJ!B.+ De (2.46) | $(s) = —— (2.49) | 


Como veremos mais adiante, é um controlador desta classe que minimiza um critério | com a sua resposta ao impulso s(t) = L-M(S(s)), adotamos a aproximação | 
quadrático parecido com o definido em (2.40). Por esse motivo, esses controladores | 


receberão particular atenção no decorrer dos próximos capítulos deste livro. e(t) = s(t) * >. e(1T)5(t — iT) (2.50) 


1=0 
2.4.2 


Discretização | | | | 
ou seja, durante todo o intervalo de tempo t € [kT, (k + 1)T) o sinal e(t) é aproxi- 


mado pelo valor constante e(kT) do início do respectivo intervalo, para todo k € N. 


ANA 


46 CAPÍTULO 2. FUNDAMENTOS DE SISTEMAS DE CON TROLE 


Definindo h(t) = c(t) x s(t), a aproximação (2.50) substituída em (2.47) fornece 
OO 
Yet) = h(t)x eGT)d(t—iT) 
i=0 


=> h(t-iTe(iT) (2.51) 
1=0 


permitindo a conclusão de que os valores da saída do controlador nos instantes de 
amostragem ye(kT) para serem dados por (2.48) impõe que cp(kT) = h(kT) para 
todo k € N. Ou seja, a função de transferência a tempo discreto do controlador é 
dada pela transformada Z das amostras em t = kT da função h(t) para k € N. De 
forma equivalente, determinamos Cp(z) = Z(h(kT)) onde 


8 


Wiata — c(s)) (2.52) 


A determinação deste controlador digital é bastante simples. Tendo sido deter- 


minada a função de transferência C(s) do controlador a tempo contínuo, estipula-se 
o período de amostragem T' > 0 e determina-se com (2.52) a função h(t). A trans- 
formada Z das amostras h(kT) é a função de transferência da aproximação a tempo 
discreto Cn(z) do controlador original C(s) a tempo contínuo. Por outro lado, a 
implementação em tempo real deste controlador também é simples. No instante 
k € N, o valor de e(kT”) é obtido através de um conversor analógico - digital. Como 
a resposta ao impulso cp(kT) para todo k € N é conhecida, obtém-se com (2.48) o 
valor de ye(kT), que é mantido na saída do controlador para todo t € [kT, (k + DT), 
através de um conversor digital - analógico. 


Exemplo 2.9 Para um controlador do tipo integrador puro C(s) = 1/s obtemos 


tos OSST 
OERE t>T 


portanto, h(0) = 0 e h(kT) =T para todo k > 1. Consequentemente 


OO 
Cpls) = Soa 
k=1 
T 
O dd 

Por outro lado, aplicando a transformada Z inversa na relação ĝe = Cp(z)ê, obtemos 
Ye((k + DT) = ye(kT) + Te(kT) para todo k E N, que nada mais é que o método de 
integração de Euler aplicado à entrada e(t) do controlador. o 
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ot | 


0 30 100 150 


Figura 2.13: Motor com controle digital 


Exemplo 2.10 Para o motor de corrente contínua, tratado no Exemplo 2.2, foi proposto o 
controlador com função de transferência C(s) = 0,25/s. Consideramos a sua implementação 
digital com dois períodos de amostragem, a saber Ti = 0,25 [s] e Tə = 2,5 [s], com os quais 
determinamos a partir do resultado do exemplo anterior as funções de transferência a tempo 


da 0,0625 0,6250 
E a E 
A estrutura básica de controle da Figura 2.8 foi implementada mas com o bloco C(s) subs- 
tituído pela sua versão a tempo discreto que incorpora um segurador de ordem zero na sua 
entrada. O lado esquerdo da Figura 2.13 mostra as trajetórias do sinal de controle ye(t) na 
saída do bloco do controlador enquanto que, no lado direito da mesma figura, mostramos 
a velocidade angular da carga v(t). As linhas tracejadas correspondem ao controlador com 
período de amostragem Tı que, ao serem comparadas com as da Figura 2.5, indicam que os 
desempenhos do controlador a tempo contínuo C(s) e de sua aproximação discreta Cp (2) 
são praticamente os mesmos. Aumentando o período de amostragem para 72, nota-se uma 
deterioração importante no desempenho do sistema em malha fechada com o controlador a 
tempo discreto Cpa(z), em comparação com o controlador a tempo contínuo C(s). O 


Exemplo 2.11 Uma outra maneira muito empregada para a determinação de uma versão 
alternativa a tempo discreto de C(s) é a chamada aproximação de Tustin. Para C(s) = 1/s 
temos 


| t 
t= | e(T)dT 
0 
Com T > 0 a aproximação trapezoidal desta integral obtemos para todo k € N 


ye((k + DT) = ye(kT) + (T/2)(e((k + 1)T) + e(kT)) 
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cuja transformada Z permite determinar ĝe = Cp (z)ê, onde Det Ci mińar as matriz 


amostragem T > 0 não parece ser uma tarefa simples do ponto de vista numérico, 
sobretudo devido à integral envolvida no cálculo de Je. Entretanto, essas duas ma- 
o SK gi ; a / o . 

odem ser calculadas simultaneamente com um único procedimento bastante 


trizes p 5 
eficiente, que envolve a determinação de uma exponencial de matriz. De fato, para 
© 3 


ou! 


Ca 


A aproximação de Tustin generaliza esse resultado para qualquer função de transferência, 


tendo em vista que se a aproximação para o operador s71 é (T/2)(z + 1)/(2 — 1), então 
a matriz quadrada 


Elas | A. B 
Co(z) = C(s)|s=3 ==: =| 0 (2.60) 
Deve ser observado que a aproximação de Tustin é bastante simples de ser obtida a partir al 
de C(s). Por outro lado, ela também produz melhores resultados conforme o período de — e t > 0, determinamos à exponencia 
amostragem diminui. | E e ad 
Fet — po sl — A, — Be 
Neste ponto, resta ainda estudar a implementação digital de um controlador a 0 E 
tempo contínuo definido pela sua representação de estado z o = 
7 spa (sI — Ae) | (sI— Ae) “Bois 
te = Agte t Doe (2.53) 0 1/s 
Ye = Cexe+ Dee (2.54) a ee Jo 7 Bedr (2.61) 
i ; 1 l 
Tendo sido escolhido um período de amostragem T > 0, para todo t > kT,k € N, a 9 
solução de (2.53) pode ser escrita na forma a qual permite concluir que 
| t ET F, C Je 
. Eus | 2:62 
telt) = AMD g(kT) + Sim) B e(r)dr (2.55) O 1l (a) 
kT 


Portanto, a partir da matriz aumentada I'e, o cálculo de sua exponencial fornece ime- 
diatamente as matrizes da representação de estado do controlador a tempo discreto. 
Basta extrair da exponencial as sub-matrizes Fe e Je com indicadas em (2.62). Note 
que as matrizes Ce e De da representação de estado a tempo contínuo permanecem 
inalteradas na representação de estado a tempo discreto. 


Por outro lado, supondo que e(t) = e(kT), para todo t € [kT, (k + 1)T) devido a 
introdução de um segurador de ordem zero na entrada, a solução da equação de 
estado (2.55) fornece 


T 
zel(k + DT) = e^t s(kT) + / e“ Bedr e(kT) (2.56) 
O 


2.5 Notas Bibliográficas 


Ou seja, a representação de estado da aproximação a tempo discreto do controlador 
em estudo é dada por 


Este capítulo, embora introduza uma visão própria dos autores a respeito dos 
problemas de síntese controle, contém material que já se tornou clássico na área. 
Uma discussão similar a respeito das vantagens estruturais dos sistemas de controle 
com realimentação ou em malha fechada em comparação com os sistemas em malha 
aberta pode ser encontrada na maioria dos livros de controle tais como [15], [25], 
[27] e [30]. Muito embora a estrutura de controle em malha fechada possa, por si só, 
suportar maiores erros de modelagem, em nossa opinião a modelagem matemática 


z((k+DT) = derak) + IERI) (2.57) 
YelkT) CexelkT) + DeelkT) (2.58) 


onde as matrizes F. e Je, de dimensões apropriadas, resultam de (2.56), ou seja 


T 
p= gh! go | e“ Bedr (2.59) 
0 


es F, e Je a partir das matrizes Ae e Be e do período de 
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tem importância estratégica nessa área. Trabalhar com bons modelos resulta, quase 
sempre, em melhores projetos de sistemas de controle. Nesse sentido, é imperativo 
consultar as referências |1|, [6], [16] e [35] para uma visão geral dos modelos nas 
áreas de mecânica e de circuitos elétricos. A implementação prática dos sistemas de 
controle foi abortada sob a ótica do chamado controle digital mas de forma muito 
menos abrangente quando comparada com outros textos clássicos, como por exemplo 
[14]. No entanto, acreditamos ter tratado com profundidade os pontos essenciais a 
esse respeito. Neste capítulo, assim como nos demais, utilizamos um conjunto de 
ferramentas matemáticas, em particular transformada de Laplace e transformada 
Z, que requerem conhecimento sólido e desenvoltura que podem ser adquiridos com 
as referências [3], [11], [13] e [16]. | 


2.6 Exercícios 


Exercício 2.1 Resolva as equações diferenciais a seguir pelo método dos coeficientes a 
determinar para todo t > 0. 


a) y+2y+5y=t, y(0)=0, y(0) =0 

b) j+H8y+15y=2e"+5, y(0)=0, W0)=1 

c) y+3y+2y = 8e"'sen(t), y(0)=1, W(0)=1 
Exercício 2.2 Resolva as equações diferenciais a seguir via transformada de Laplace para 
todo t > 0, lembrando que ô(t) é o impulso unitário e u(t) é o degrau unitário. 

a) j+2)+9= ôt) +2u(t), y(0)=0, )(0)=0 

b) jtSyt4y=te o, y(0)=1 , y(0)=1 

c) j+6y+34y=e*sen(5t+ 5), y(0)=0, y(0)=1 
Exercício 2.3 Resolva as equações a diferenças pelo método dos coeficientes a determinar 
para todo k > 0. 

a) kr) +Iy(K+D +20) =11(—2)F , y(0)=1 , y(1)=1 

b) y(k +2) — 12y(k + 1) + 20y(k) = 9k? — 2k + 1 + 75,24(0, 0º, y(0)=0 , y(1)=0,4 

c) y(k +2) +5y(k + 1) + Gy(k) = 10cos(3k) , y(0)=1 , y(1)=0 


Exercício 2.4 Resolva as equações a diferenças via transformada Z, Yk > 0. 


a) ylk +2) +9y(k +1) + 14y(k)=5f , y(0)=2, y(1)=1 
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b) y(k + 2) + Gy(k + 1) a a 82 k 3 u0)=1,y(l)=2 
Exercício 2.9 A resposta de um sistema a tempo contínuo, sob condições iniciais nulas, 
para uma entrada do tipo rampa unitária é dada por 


y(t) = 20t — 30 + 40e™* — 100, Vt>0 


a) Qual é sua função de transferência? 
b) Qual é sua resposta ao impulso? 


c) Para a entrada g(t) = 30 sen(20t) qual é sua resposta em regime permanente? 


Exercício 2.6 A resposta de um sistema a tempo discreto, sob condições iniciais modifi- 


cadas nulas, para uma entrada do tipo degrau unitário é dada por 


y(k) = 10 — (0,4)* + (-0,5)º, Yk EN 


a) Qual é sua função de transferência? 
b) Qual é sua resposta ao impulso? 


2 e 2 
c) Para a entrada g(k) = sen(rk/6) qual é sua resposta em regime permanente: 


Exercício 2.7 Um sistema a tempo contínuo de fase minima (aquele em que todos os seus 
polos e zeros estão situados no semiplano esquerdo complexo) apresenta o diagrama de Bode 
assintótico de módulo segundo a Figura 2.14. Sabendo que este sistema apresenta um por 
de polos complexos conjugados com fator de amortecimento igual a 0,5; determine a punção 
de transferência G(s) do sistema e esboce seu diagrama de Bode de fase. Se este sistema 


—40 dB/dec 


16 rad/s 40 rad/s 


2 rad/s 4 rad/s 
Figura 2.14: Diagrama de Bode para o Exercício 2.7. 


for excitado por um sinal senoidal de frequência 10 jrad/s|, calcule a sua saída em regime 


permanente utilizando os diagramas de Bode. 
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Exercício 2.8 Um sistema a tempo contínuo de fase mínima apresenta o diagrama de 
Bode assintótico de módulo segundo a Figura 2.15, sendo que todos os seus polos e os zeros 
são reais. Determine a função de transferência G(s) do sistema e esboce seu diagrama de 
Bode de fase. Se este sistema for excitado por um sinal senoidal de frequência 4 [rad/s], 


—20 dB/dec 


! 
2 ndk 5 ndi 10 rad/s 
Figura 2.15: Diagrama de Bode para o Exercício 2.8. 
calcule a sua saída em regime permanente utilizando os diagramas de Bode. 
Exercício 2.9 Na Figura 2.16 o veículo 2 persegue o veículo 1, segundo o modelo 
TÙ +2 = v1 , T =3 [s] 


e o condutor do veículo 1 imprime a velocidade vi(t) apresentada na mesma figura. 


vı [km/h] 
A 
U2 uv 
oe B 6/08 N | 
E | i Ed | 
7 T Ec y e ra a > “g [s] 
E ends 20 
d 


Figura 2.16: Veículos em perseguição. 


a) Se v2(0) = 0, esboce vo(t) para t > 0. 

b) Em t= 15 [|s], qual a diferença de velocidade entre os dois veículos? 
c) Em t = 15 [s] qual a velocidade do carro 2? 

d) Repita os dois itens anteriores para t = 50 [s]. 


e) Se em t = O mediu-se d = 40 [m], qual é a distância entre os dois veículos em 
t = 20 [s]? 
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Exercício 2.10 Uma mola com constante elástica n e comprimento em repouso lo está 


presa por uma extremidade ao teto. Em sua outra extremidade há uma massa m, de acordo 


com a Figura 2.17. Considerando que durante o movimento a mola não se dobra: 


Figura 2.17: Pêndulo com mola. 


a) Obtenha o modelo matemático que descreve o movimento da massa. 
b) Encontre um ponto de equilíbrio do sistema. 


c) Linearize o modelo em torno do ponto de equilíbrio calculado no item anterior. 


Exercício 2.11 A Figura 2.18 mostra uma corda de massa m uniformemente distribuída 
em seu comprimento, que se apoia sobre uma roldana de raio r e momento de inércia J. Em 
t=0 a corda começa a escorregar exclusivamente sob a ação de seu peso e, sem patinar, faz 
a roldana se movimentar. Determine o tempo decorrido para que a corda comece a cair em 


Gott, 


l 


Figura 2.18: Massa distribuída em movimento. 


queda livre, isto é, o instante imediatamente após a mesma deixar de ter qualquer contato 
com a roldana. Considere que o comprimento da corda é muito maior que o raio da roldana. 


Exercício 2.12 Considere o sistema dinâmico representado na Figura 2.19, no qual J é 
o momento de inércia da barra em relação ao ponto fixo O. 
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ixercício 2.14 No sistema da Figura 2.21, o cilindro tem raio r e momento de inércia Jı 
e a barra tem comprimento 2L e momento de inércia Jo, sendo que ambos giram em torno 
(= É iros fixos e perpendiculares ao plano da página. A superfície de contato entre a massa 
G i =, dai a o solo é perfeitamente lisa e a superfície de contado entre o cilindro e a massa m é 


perfeitamente pr | da 
o s equações diferenciais que descrevem a dinâmica do sistema linearizado em torno de um 


aderente; b é o coeficiente de atrito viscoso entre a massa m e o ar. Determine 


ponto de equilíbrio, bem como a sua representação de estado considerando como entrada f(t) 


e como saídas y(t) e 0(t). 


a 
3S 
5 


Figura 2.19: Oscilador apoiado sobre uma barra. 


A K1 
Lo m 
, PE e Jo h 
a) Determine o modelo matemático para 0(t). É or, > 
b) Sob a hipótese de pequenas perturbações, qual é a frequência natural de oscilação da = K2 ft) 
barra? £ S 


c) Para f(t) = fo constante, qual o valor de O(t) para t > O suficientemente grande, 
fornecido pela solução do modelo matemático linearizado? 


Exercício 2.13 Considere uma barra cujo momento de inércia em relação ao seu centro Figura 2.21: Cilindro e barra em movimento de rotação. 
de massa O é denotado por J. Ela se encontra apoiada sobre um sistema amortecedor, de 


acordo com a Figura 2.20. Supondo que o ponto O está fixo, escreva as equações do movi- J. | o | f 
Exercício 2.15 No sistema dinâmico representado na Figura 2.22, uma massa M está 


presa à parede por uma mola de constante elástica k e o coeficiente de atrito viscoso entre 


: O a massa e o ar é denotado por b. Essa massa está conectada a um sistema de engrenagens 
a aa e cujos momentos de inércia são Jı e Jo e seus respectivos raios são denotados por rı e ra. 
| | go 1 O conjunto é movimentado por uma força externa f(t). 
| Ria | | Ma | a) Determine o modelo matemático que relaciona o deslocamento da massa M com a 
a d força f(t). 
Ri O abs | b De ralis ud 
i C e E e Ea Do b) Qual a frequência natural de oscilação da massa M ? 
o aeaa o o c) Para uma força f(t) do tipo degrau unitário qual o valor da posição da massa M para 
€ t>0 suficientemente grande? | 
Figura 2.20: Sistema amortecedor. | — d) Considerando M = 1,5 [kg], b = 1,5 [Ns/m], k = 0,25 [N/m], Jı = 3,6 x107? [kg m?), 


J2 = 1,0 x 107° [kg m°], rı = 0,3 Mm e r2 = 0,1 m, qual o comportamento da posição 
da massa M para t > O suficientemente grande quando a força aplicada é do tipo 
f(t) = sen(2t)? 


mento para o sistema em termos do ângulo que a barra faz com a horizontal, considerando 
pequenos deslocamentos. 
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Figura 2.22: Sistema Massa-mola-engrenagens. 


e) Queremos fazer com que a massa M se desloque até a posição Tref e nela permaneça 
por tempo indeterminado. Para atender tal especificação, é necessário projetar um 
sistema de controle em malha fechada de modo que o erro entre a posição desejada 
r(t) = Tref, t > 0, e a posição atual x(t) seja processado por um controlador C(s), a 
fim de sintetizar a força f(t) adequada. Esquematize o diagrama de blocos referente 
ao sistema em malha fechada descrito. 


f) Se implementarmos um controlador do tipo proporcional C(s) = kp, qual é a função 
de transferência do sistema em malha fechada? Qual é o valor de regime da posição 
z(t) para uma referência do tipo degrau de amplitude Eres? 


g) Ao substituirmos o controlador do item anterior por um controlador integral C(s) = 
ki/s qual é o valor de regime da posição x(t) para a mesma entrada degrau utilizada 
no item anterior? Discuta se é possível utilizar qualquer valor de ganho ki. 


h) Suponha que a saída do controlador C(s) seja afetada por um ruído aditivo w(t). 
“Represente, no diagrama de blocos do item e), a influência deste ruído e determine 
a função de transferência em malha fechada entre o ruído ù(s) e a posição (s) da 
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Figura 2.23: Pêndulo com translação. 


e) Calcule a função de transferência entre a posição horizontal x(t) da massa M e a 


força aplicada f(t). 


f) Considerando f(t) = fo constante determine o comportamento do deslocamento an- 


gular O(t) do pêndulo em regime permanente. 


9) Queremos controlar a posição horizontal da massa M, fazendo-a se deslocar até a 


posição r(t) = Lref. Para atender tal objetivo, sintetizaremos a força f(t) processando- 
se o erro r(t)— x(t) utilizando um controlador C(s). Esquematize o diagrama de blocos 
referente ao sistema em malha fechada descrito. 


h) Utilizando um controlador do tipo proporcional-derivativo C(s) = Kp + Kas para con- 


trolar a posição da massa M, calcule a função de transferência do sistema em malha 
fechada entre a referência r(t) e a posição x(t). 


i) Para o controlador do item anterior, com Rp > O e ka > 0, calcule a função de 


transferência entre a referência r(t) e a posição do pêndulo O(t). A seguir, determine 
o comportamento em regime permanente de O(t) para uma referência do tipo degrau 
de amplitude Tref. 


massa M. e a 
j) Considere que exista um ruído aditivo v(t) na entrada do sensor que mede a posição 


x(t) da massa M e que o sensor não seja ideal, mas seja um sistema de primeira 
ordem do tipo H(s) = 1/(Ts+1). Modifique o diagrama de blocos do item g) de modo 


a incluir este ruído e calcule a função de transferência entre o ruído d(s) e a posição 


Exercício 2.16 Uma massa M desliza sem atrito pelo teto de um galpão com um pêndulo 
simples preso a si, o qual pode oscilar livremente e sem a interferência de atrito viscoso, 
segundo a Figura 2.25. 


a) Determine o modelo matemático que descreve os deslocamentos da massa e do pêndulo. | 
Exercício 2.17 Dois corpos de massas M em estão conectados entre si através de um 
amortecedor, conforme ilustra a Figura 2.24, e se deslocam sobre um plano horizontal per- 
fog 3 n . s 4 e 2 
feitamente liso. Uma das extremidades de uma mola de constante elástica k está conectada 
ao corpo de massa m enquanto, em sua outra extremidade, é aplicada uma força f(t). 


b) Linearize o modelo obtido em torno de um ponto de equilíbrio. 
c) Determine a frequência natural de oscilação do sistema linearizado. 


d) Calcule a função de transferência entre o deslocamento angular O(t) e a força aplicada 


fŒ). 


a) Escreva as equações diferenciais que descrevem o seu modelo matemático. 
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Figura 2.24: Massas acopladas por amortecedor. 


b) Calcule a função de transferência entre a velocidade da massa M e a força aplicada 
FE). 
c) Calcule a função de transferência entre o deslocamento z(t) da extremidade da mola 


e a força f(t). 


d) Obtenha a representação de estado correspondente à função de transferência calculada 
no ttem anterior. 


e) Deseja-se controlar a velocidade da massa M utilizando um sistema de controle em 
malha fechada e, para isso, um projetista decidiu medir a posição z(t) da extremidade 
submetida à força f(t) e compará-la com um sinal de referência r(t) adequado. O 
erro entre r(t) e z(t) deve ser processado por um controlador C(s) para sintetizar a 
força f(t). Esquematize o diagrama de blocos do sistema em malha fechada descrito. 


f) Calcule a função de transferência em malha fechada entre o sinal de referência r(t) 
e a velocidade da massa M. 


g) Se utilizarmos um controlador proporcional C(s) = kp, qual o tipo de sinal de re- 
ferência r(t) que deve ser empregado para fazer com que a massa M se desloque com 
velocidade constante em regime permanente? 


Exercício 2.18 No sistema mecânico da Figura 2.25, uma massa m encontra-se no inte- 
rior de uma caixa aberta de massa M. O coeficiente de atrito viscoso entre as superfícies das 
duas massas é be a superfície sobre a qual se encontra a caixa é perfeitamente lisa. Deter- 
mine as funções de transferência e suas respectivas representações de estado que relacionam: 


a) o deslocamento x(t) da massa m e a força aplicada f(t). 
b) o deslocamento y(t) da massa M e a força aplicada f(t). 


c) o deslocamento z(t) do ponto entre as duas molas e a força aplicada f(t). 


Queremos controlar o deslocamento relativo da massa m em relação à caixa x(t) — y(t) 
utilizando a medida da posição y(t). Para isso, devemos implementar um sistema de controle 
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Figura 2.25: Sistema mecânico. 


em malha fechada no qual um sinal de referência adequado r(t) é comparado com o valor 
atual y(t). O erro entre estes sinais será a entrada de um controlador C(s) que sintetizará 
a força f(t) adequada. Esquematize o diagrama de blocos correspondente ao sistema em 
malha fechada descrito e calcule a função de transferência entre a referência e a grandeza 


de interesse. 


Exercício 2.19 O circuito elétrico representado na Figura 2.26 é alimentado por uma 
fonte de corrente denotada por i(t). Determine a função de transferência o(s) /i(s). 


Cs 


HOAR Gi E 
(O O Ro 


) 
Q 
J| 
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Figura 2.26: Filtro elíptico. 


Exercício 2.20 O circuito elétrico representado na Figura 2.27 é alimentado por uma 
fonte de tensão denotada por ve(t). Determine a função de transferência d(s)/de(s). 
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Figura 2.27: Filtro Butterworth passivo. 


Exercício 2.21 O circuito eletrônico da Figura 2.28 é alimentado por uma fonte de tensão 
denotada por ve(t). Determine a função de transferência d(s)/del(s) sabendo que o ampli- 
ficador operacional, representado pela função de transferência A(s) = Ao/(Ts + 1), apre- 


senta impedância de entrada infinita e impedância de saída nula. Verifique o que ocorre 


Figura 2.28: Filtro ativo. 


com a função de transferência do circuito quando Ao — œo. Para esta função obtida e 
Cı = 1,5 [uF], C2 = 0,33 [LF], Rj = 10 [kQ] e Ro = 5 [kQ], calcule o tempo de esta- 
bilização e a sobre-elevação máxima se velt) for um degrau de tensão. Calcule também a 


largura de faixa do circuito. 


Exercício 2.22 No circuito da Figura 2.29, à(s) é uma fonte de tensão, Ai(s) e Ag(s) 
representam, respectivamente, as funções de transferência de um amplificador diferencial e 
de um estágio de saída, dadas por 


Ay 
Tıs +1 


A2 


A = EA Er 
1(8) Tos+1 


e A(s) = 
e Rı e Ro são resistências. Considerando (s) a saída de interesse e supondo que as 
impedâncias de entrada dos amplificadores são infinitas e suas impedâncias de saída são 
nulas: 
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Figura 2.29: Amplificador não-inversor. 


a) Calcule a função de transferência entre a saída (s) e a entrada û(s). 
b) Calcule a função de transferência entre o saída d(s) e o ruído wWw(s). 
c) Esboce o diagrama de blocos correspondente ao circuito em malha fechada. 


d) Supondo As 20, Ass 1 Tr 1078 [s], Tə = 1072 [s], = haa [k9] e 
u(t) um degrau de amplitude 5 [V], calcule o valor de v(t) em regime permanente com 
w(t) = 0. 


e) Compare a largura de faixa do sistema em malha aberta com a largura de faixa do 
sistema em malha fechada. 


f) Considerando os dados do item anterior, se ocorrer uma variação de 20% no valor de 
AY, qual será a variação percentual no valor de regime de v(t)? 


g) Supondo que o ruído seja do tipo w(t) = 0,1sen(100t) [V], determine a relação sinal- 
ruído existente na saída do amplificador para o sistema em malha aberta e para o 
sistema em malha fechada. 


Exercício 2.23 Para cada função de transferência dada a seguir, localize no plano com- 
plexo a menor região Q em que se encontram todos os seus polos. Estime o valor do tempo de 
estabilização para uma entrada do tipo degrau unitário e compare com os resultados obtidos 
via simulação numérica. Discuta a validade da aproximação via polos dominantes. 


| m 340(s + 1) 

bs | MA S o 
OAE) s2+ 48413 A (s + 10)(s2 + 10s + 34) 

F 130 50(s + 4) 

0) H(s)=-———D[—————— de LDO uu O 
HO) = EFE) e H) = To ds +20)(8 + 6s + 10) 
DE e pes e 


(s + 3)(s2 + 45 + 13) (s + 2)(s2 + 8s + 25) 
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Jie (1632/25)(s? + 8s + 25) Hias —(13/4)(s — 1)(s + 4) “Exercício 2.27 Considere os sistemas de controle esquematizados nas Figuras 2.81, 2.32 
9 = (s + 3)(s + 4)(s2 + 125 + 136) (s + 1)(s2 + 6s + 13) F à q Para cada uma das configurações, calcule a função de transferência em malha fechada 
BsdvV. 


o entrada f(s) e a saída (s) e também entre o distúrbio d(s) e a saída y(s). 
P e a A . Ls . - o | 
xercício 2.24 Para as funções de transferência do exercício anterior esboce seus respec- ntre a 


tivos diagramas de Bode de módulo e fase e calcule, para cada caso, sua faixa de passagem, 


nã | = o | P(s)+ s+ 10 10 Y(s) 
Exercício 2.25 Considere o circuito eletrônico da Figura 2.30, na qual o amplificador 4) RESET 56513) a 
operacional é representado pela função de transferência A(s) = Ao/(Ts + 1). Calcule q = l 4 
função de transferência entre a entrada dels) e a saída d(s) para as seguintes situações: : + à(s) 

| Y 
| C) 
s+5 e 


d(s) 
| A 
P(s) + | gI E J + s+4 g(s) 
ja) e peso 
ER | 
o iss DD: 


Figura 2.30: Controlador analógico. 


a) Considerando Zı uma resistência de valor R e Za uma capacitância de valor C. 


Figura 2.32: Diagrama de blocos (b). 


b) Considerando Z, uma capacitância de valor C e Zo uma resistência de valor R. 


Em seguida, para cada função de transferência obtida, suponha que Ag > co e determine 
a nova função de transferência. Verifique que, na primeira situação, obtemos a função de 


s+01 
transferência de um controlador proporcional-derivativo (PD) enquanto na segunda obtemos RETO | 
a função de transferência de um controlador proporcional-integral (PI). d(s) 
Fls Eo ES i E2 +T g(s) 


Exercício 2.26 Ao escolher a estrutura de um controlador para o projeto de um sistema 


em malha fechada, um dos pontos a que se deve atentar é sobre a qualidade do sinal de 


saída do controlador na presença de ruídos aditivos em seu canal de entrada. Considerando 


os controladores proporcional-derivativo (PD) e proporcional-integral (PI) calculados no e- 
xercício anterior, calcule a amplitude da relação sinal-ruído que existiria na entrada e na 


saída dos controladores considerando que o sinal de entrada é dado por velt) = s(t) + r(t), Figura 2.33: Diagrama de blocos (c). 


em que s(t) = Asen (Y5 t) é o sinal e r(t) = Asen (48t) é o ruído aditivo. 
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Exercício 2.28 Dados os controladores a seguir no contexto de sistemas a tempo contínuo 
obtenha os equivalentes discretos utilizando a discretização via segurador de ordem zero e 
pela fórmula de Tustin com períodos de amostragem Tı = 50 [ms] e Tə = 0,5 [s]. 


ORNER (o) (iii) Ca(s) = 3 x 107? (255) | | 
(ii) Co(s) = 2 x 107? (=) : Capít ulo 3 


Esses controladores foram projetados para controlar, em malha fechada de acordo com a 
Figura 2.34, um sistema de engrenagens cuja função de transferência entre o deslocamento 
O(t) e o torque aplicado Ta (t) é dada por | 


Fundamentos Matemáticos 


TOIS s(Js +c) 


onde k = 5,7669, J = 8,2067 x 1074 e c = 1,1 x 107, em unidades coerentes do SI. Para Sl Introdução 
cada um dos controladores dados determine, utilizando um pacote computacional: | 


€ Este capítulo é inteiramente dedicado a expor detalhadamente todas as ferra- 
mentas matemáticas que serão utilizadas nos capítulos seguintes. Os tópicos serão 
tratados de maneira precisa, com a preocupação de dar ênfase aos aspectos teóricos 
realmente importantes para os desenvolvimentos futuros. Embora sejam bastante 
conhecidos, pretendemos expô-los de forma diversa, tendo em vista os nossos próprios 
objetivos. Vários exemplos numéricos serão resolvidos com o intuito de ilustrar os 
conceitos e as manipulações algébricas introduzidas. Este capítulo requer alguns 
conhecimentos básicos de funções de variáveis complexas e de matrizes. 


Ô(s) 


G(s) 


5 HO C() 


Figura 2.34: Controle em malha fechada. 


a) o valor de pico e o tempo de estabilização do sistema em malha fechada; 


b) os valores das grandezas do item anterior através da aproximação de polos dominantes 3.2 Princípio da Variação do Argumento 


e compare os resultados; 


Substituindo os controladores contínuos pelos equivalentes discretos: 
Antes de estudarmos o m incípi iacã 
à ch , 
amado princípio da variação do argumento, resultado 


central no estudo de sistemas de controle, é preciso recordar alguns conceitos básicos 
de funções de variáveis complexas. Seja f(z): D c C > F C C uma função que leva 
elementos de um subconjunto dos números complexos para elementos de um outro 
T conjunto dos números complexos. É importante salientar que D, o domínio de 
fio), é um subconjunto aberto de C, sendo F sua imagem ou contra-domínio. O 
conceito de limite é de particular importância. Para zọ € D, calcular o limite 


c) refaça o item a) com os dois períodos de amostragem. Comente. 


d) determine o maior valor do período de amostragem T para assegurar a estabilidade Ê 
do sistema em malha fechada. 


fo = lim f(z) (3.1) 


220 
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indica que para todo € > 0 existe ô > 0 tal que |f(2) — fol < e para todo |z — zo| < 6. 


~ . A e lica, fazendo com que, geralmente, o valor da integral ão sei 
A interpretação desse conceito é que, no plano complexo definido por Re(z) x Im(z), e ap gral em (3.3) não seja nulo. 


) a ) e PO) sejadevada soe S “Observe, entretanto, que O resultado será o mesmo independentemente da escolha 
ualquer trajetória que leve z para zo faz com que J(2) seja levada à Jo. de O | $ | E E 
ER J q p j q J 9 RES específica de C. Por exemplo, considere f(z) uma função analítica em um domínio 


a igualdade To= f (20), à função é dita contínua em zo € D. A derivada de f(z) em D, uma curva fechada Caon a e A O a C cas 
relação a z em zo € Dé definida por condições, a fórmula integral de Cauchy estabelece que 


f= fla) f(2) 


Z> 20 Z— 20 z oo ai 2Tj f (zo) (3.4) 


(3.2) 
onde se deve obviamente exigir que o limite indicado exista, ou seja que a relação 
seja invariante em relação a qualquer trajetória segundo a qual z tende a zo. Devido 
a esta invariância, algo semelhante a se exigir que a derivada direcional de uma 
função de duas variáveis seja invariante com a direção escolhida, a existência de 
f'(z) para z € D requer que duas condições, denominadas condições de Cauchy- 
Riemann, sejam satisfeitas. Elas também tornam operacional o cálculo de derivadas 
das mais variadas funções. O conceito de derivada permite introduzir a seguinte 


definição, que é central no estudo de funções de variáveis complexas. 


Note que o teorema integral de Cauchy não se aplica neste caso pois, embora f(z) 
seja analítica, a função f(z)/(z— zo) não é analítica em z = zo sempre que f (zo) + 0. 
Note que o resultado da integral é invariante com a escolha de C que contém 29 e 
que está contida em D. 

Uma função f(z) analítica em um domínio D pode ser desenvolvida em série 
de Taylor. Isto é, considerando zo € D, o valor de f(z) para todo z pertencente à 
região circular {|z — zo| < Rj C D é dado por 


OO 
Definição 3.1 (Função analítica) Uma função de variável complexa f(z), defini- fiz) = > cilz — 20) (3.5) 
da em um domínio D C C é analítica em D se f'(z) existir em todo z € D. i=0 
As condições de Cauchy-Riemann, aplicadas a todos os ponto z € D, permitem onde c; = f® (zo)/i! para i = 0,1,- +: ,+00 são os coeficientes da série. A série de 


Taylor, calculada em zo, converge para todo z situado no interior da maior região 
circular acima definida, inteiramente contida em D. 

Uma generalização importante da série de Taylor é a chamada série de Laurent. 
Ela é empregada quando existe no interior de D uma região ou um ponto isolado 
em que a função f(z) não é analítica. Seja zo € D um ponto qualquer do domínio 
D onde f(z) não é analítica. O valor de f(z) em qualquer ponto no interior do anel 
{r < |z — zo] < R} C D em que ela seja analítica é dado por 


identificar se f(z) é uma função analítica. A existência da derivada f'(z) por ser, 
como vimos anteriormente, uma operação singular, faz com que a derivada de funções 
analíticas se escreva diretamente em termos da variável complexa z € D, como sendo 
uma expressão idêntica àquela que seria obtida considerando z uma variável real. 
Por exemplo f(z) = Xio ai e f(z) = e” são funções analíticas em todo o plano 
complexo. A soma, o produto e a divisão de funções analíticas em D são analíticas 
em D desde que, na divisão, D não contenha nenhum ponto onde o denominador 


se anule. Assim sendo, uma função racional é analítica em todo domínio que não +oo 

contenha nenhum de seus polos. file X cilz — zo) (3.6) 
Decorre das condições de Cauchy-Riemann um importante resultado conhecido i=—00 

como teorema integral de Cauchy. Seja f(z) uma função analítica em um domínio onde ci, i = —00,:-- ,+00 são os coeficientes da série. A diferença entre a série 


D e seja C uma curva fechada simples inteiramente contida em D, isto é, todos os 


de Tay. 4 É , 
| | aylor e a de Laurent é que a segunda contém termos com potências negativas. 
pontos de C e todos os pontos do seu interior pertencem a D. Nesse caso, vale a 


Nesse senti o A os p E 

sse sentido, é óbvio que a segunda é uma generalização da primeira, que é obtida 
ara Cj = a= A 

pe i = 0 para todo i = —1,:-- ,—o0 quando a função for analítica. 


Exemplo 3.1 A funçã 

NE ¿L A função exponencial f(z) = e” é analítica em t | 
o m todo o pl 
Considerando zo = 0, obtemos plano complexo. 


igualdade 
$ fade =0 (3.3) 
C 


onde o sentido de percurso é o anti-horário. Quando a curva fechada ČC envolver uma 
região do domínio de f(z), onde ela deixa de ser analítica, O resultado acima não 
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Definição 3.2 (Resíduo) O resíduo de f(z) em zo, denotado por R(f,20), é o | 


que é válida para todo z € C. | n 
jente c—ı da expansão em série de Laurent de f(z) em zo. 


coefic 
Desta definição, podemos concluir que se f (z) for analítica em todos os pontos de 
um domínio D e zo for um ponto qualquer do seu interior então a função f(z), pode 
ser desenvolvida em série de Taylor e, assim, o resíduo em 29 é nulo. Se, entretanto, 
o ponto 20 for um ponto singular isolado o desenvolvimento de f(z) em série de 
Laurent, fornece o resíduo em Zo. 

Uma das mais importantes propriedades do resíduo de uma função f(z), analítica 
em todos os pontos do domínio D à exceção de um ponto singular isolado 29 € D é 


Exemplo 3.2 A função racional f(z) = 22/(z + 1)(z — 1) é analítica em todo o plano 
complexo salvo em seus polos que são os pontos isolados {—1,1}. Através da decomposição 


em frações parciais temos 


1 1 
Moa o] 


sendo que, nos pontos onde cada parcela for analítica, as suas derivadas sucessivas são dadas 


d LN (io d LO (Ii! 
dz \z+1 no TETN dz \z—-1 B (z — + 


A função f(z) pode ser desenvolvida em série de Taylor em zo = 0. De fato, calculando as 
derivadas acima em zo = 0, vem 


por 


que 


Pta: = IIR fizo) (3.7) 


para toda curva fechada C C D que contém zo no seu interior. Como anteriormente, 
o resultado é invariante com a escolha da curva C desde que ela esteja em D e tenha 
zo no seu interior. | 

O teorema dos resíduos de Cauchy generaliza esse resultado para funções que 
admitem vários pontos singulares isolados. Seja f(z) uma função analítica em um 
domínio D e sejam z, € D para k = 1,:-- ,n seus pontos singulares isolados, então 


fo =P (C -1)7 
= 


% 


que é válida na região circular |z| < 1. Observe que essa é a maior região circular com centro 
em zo = 0 onde f(z) é analítica em todos os seus pontos. Podemos desenvolver essa mesma 
função em série de Laurent em zo = —1. Para isto, é imperativo notar que sendo a parcela 


1/(z — 1) analítica em zo = —1, ela pode ser desenvolvida em série de Taylor, ou seja 


| | 1 Z | | 
| 0)= 1" A aa fade = 2rj >, R(f, ze) (3.8) 


i=0 


que é válida para qualquer ponto pertencente ao anel 0 < |z + 1| < 2. Novamente, é 
interessante observar que esse é o maior anel com centro em zo = —1 onde f(z) é analítica, 
De maneira similar, a série de Laurent em zo = 1 se expressa na forma 


ro= +45 ate 


onde C é uma curva fechada qualquer contida em D e que contém no seu interior os 
pontos singulares isolados 21,22," :*, 2r- É claro que se Č for escolhida de tal forma 
a não conter nenhum ponto singular isolado de f(z), a integral em (3.8) se anula, 
em conformidade com (3.3). 


"Exemplo 3.3 A função obtida pela transformada de Laplace da resposta ao impulso do | 


i=0 
Ji segurador de ord 
que é válida para todo z € C pertencente ao anel 0 < |z — 1| < 2. Este exemplo mostra que & S e. 
não há maiores dificuldades para se desenvolver qualquer função racional em série de Taylor Tora D la 
z 


ou de Laurent. E , ne 
é analítica em todo o plano complexo C, inclusive em 29 = 0. Desenvolvendo e-!* em série 


Um ponto zo € C é uma singularidade isolada da função f(z) se f(z) for analítica de Taylor em zo = 0 obtemos imediatamente 


em todos os pontos de uma vizinhança de zo mas não for analítica em 29. À função | aê 

racional f(z) = N(z)/D(z), onde N(z) e D(z) são polinômios com coeficientes reais f(x) = TS, ET 
(as O | 
1=0 


é analítica em todos os pontos do plano complexo à exceção dos seus polos, ou seja, 
as raízes da equação algébrica D(z) = 0. Portanto, todos os polos de uma função 


racional são pontos singulares isolados. 


| Portanto, o resíduo em zọ = 0 é zero. A função f(z) = (1 +e717)/z tem um ponto singular 
isolado em zo = 0. Nesse ponto, o resíduo é 2. m 
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Exemplo 3.4 A decomposição em frações parciais é uma ferramenta poderosa para de- 
terminar os resíduos dos polos de uma função racional. Seja f(z) = N(z)/D(z) uma função 


racional com polos z1,---,2Zn. A decomposição em frações parciais permite escrevê-la na 
forma alternativa 


onde my; denota a multiplicidade do polo Zk e ng o número de polos distintos. Com os 
resultados anteriores (veja o Exemplo 3.2), concluímos imediatamente que R(f, zk) = fm 
para todo k = 1,:-:,ng. Ou seja, a decomposição em frações parciais fornece como sub- 
produto os resíduos de todos os polos da função racional em estudo. O 


Estamos em condições de aplicar o teorema dos resíduos de Cauchy para calcular 
a integral de uma função de variável complexa, pertencente a uma classe muito 
especial que será bastante usada em seguida. Trata-se da função definida na forma 


C—C (3.9) 


onde g(z) é uma função dada. Em primeiro lugar é imperativo estudar em que 
regiões do plano complexo uma função assim definida é analítica. Como f(z) é o 
resultado da divisão de duas funções, supondo que g(z) seja uma função analítica em 
todo o plano complexo à exceção de um número finito de pontos singulares isolados 
P1, + , Pn € que ela se anule nos pontos z1,:--,2m concluímos que f(z) é analítica 
em todos os pontos do plano complexo à exceção de p1,::: , Pn e de 21, , Zm. Em 
segundo lugar, passamos a calcular o resíduo da função f(z) em relação a cada um 
desses pontos. Para todo à = 1,--- ,n denotando por m; a multiplicidade do polo p; 
de g(z), existe uma função gi;(z) analítica em p; tal que 


(3.10) 


e assim obtemos (e) 
Mi GL 
f) GER E (GA) 
Como gi(pi;) # 0 e gi;(z) é analítica em p;, a relação g;(2)/gi(z) pode ser desenvolvida 
em série de Taylor e assim R(f,p;) = —m; para todo i=1,---,n. 
Da mesma forma, para todo j = 1,--- ,m denotando por n; a multiplicidade do 
zero z; de g(z), existe uma função p;(z) analítica em z; tal que g(z) = (2— 2;)"ip;(2) 
e portanto 


Ne” 


Nj plz 


(3.12) 
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Novamente, como pi(z;) 7 0 e pila) analítica em zj, à relação pj(2) py (e) pode 

- desenvolvida em série de Taylor e, assim, R(f,2;) = nj para todo j = Less 
Sa resumo, a função (3.9) tem como pontos singulares isolados todos os zeros e os 
los da incas g(z). De maneira equivalente, podemos dizer que os polos da função 

(z) são OS polos e os zeros da função g(z). O resíduo de f(z) em cada polo de g(z) 
x a à sua multiplicidade com sinal trocado enquanto que o resíduo de f (z) em 
a zero de g(z) é igual à sua multiplicidade. Com base nestes cálculos o seguinte 


resultado é estabelecido. 


Tema 3.1 Seja g(z) uma função dada e C uma curva fechada. A igualdade 


L o rs 3.13) 
o fai | 


onde N; e Np são, respectivamente, O número de zeros e o número de polos de g(z) 
A 
situados no interior de C, se verifica. 


Prova : Com o teorema dos resíduos aplicado à função f (z), definida em (3.9), 
temos 


ES $ mou E 
219 JO 


Riz) + >X Rp) 


2E interior C p;e interior C 
= ; Nj = Mi 
z;€ interior C p;€ interior C 


onde N, e Np são, respectivamente, o número (contadas as multiplicidades) de zeros 
e polos de g(z) situados no interior da curva C. Isto prova o lema proposto. o 


A igualdade (3.13) se verifica como uma consequência direta do teorema dos 
resíduos tendo em vista que, como determinamos anteriormente, os polos de f(z) 
são os polos e os zeros de g(z). Alternativamente, a integral que aparece no lado 
esquerdo da equação (3.13) pode ser calculada de uma maneira diversa, ou seja 


g'(2) o o 
$ o de = $ din(g(2)) 
= j arg (g(2))lo (3.15) 


onde o lado direito da segunda igualdade indica o cálculo do argumento de g(z) 
enquanto z percorre a curva fechada C. Com base nessa igualdade e naquela do 
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Lema 3.1, podemos enunciar um dos mais importantes resultados, que será exaus- 


tivamente utilizado no decorrer do estudo de estabilidade de sistemas dinâmicos a 


ser apresentado mais adiante neste capítulo. 


Princípio 3.1 (Variação do argumento) A variação do argumento de glz) 

? 
quando z percorre a curva fechada C, é igual à diferença entre o número de zeros e 
o número de polos de g(z) que se encontram no interior de C, ou seja 


1 
57 Acarglg(z)) = N: — Np (3.16) 


A igualdade (3.16) pode ser verificada sem grandes dificuldades. Nesse sentido, 
as seguintes etapas podem ser estabelecidas : 


1. Dada uma função g(z) e uma curva fechada C, determina-se os polos e os 
zeros de g(z) e, por consequência, o número de polos (Np) e de zeros (N.) que 
se encontram no interior de C. Para que esta operação se realize, a curva C 
escolhida não pode passar sobre nenhum polo ou zero de g(z). 


2. Em seguida, determina-se o mapeamento de todos os pontos de C através da 
função g(z) dada. Como C é uma curva fechada o mapeamento dos pontos do 
plano Re(z) x Im(z) pertencentes a C resulta em uma curva fechada no plano 
Re(g(z)) x Im(g(z)). A variação do argumento de g(z) dividida por 27 que 
aparece no lado esquerdo de (3.16) nada mais é que o número de voltas que o 
mapeamento dá em torno da origem do plano Re(g(z)) x Im(g(z)). Note que 
essa quantidade tem sinal algébrico positivo se o sentido de percurso de Č e 
de seu mapeamento coincidem e negativo caso contrário. 


A parte mais difícil de ser executada é, sem dúvida, a determinação do mapea- 
mento dos pontos de C através de g(z). Entretanto, como desejamos apenas contar o 
número de voltas que ele dá em torno da origem, apenas alguns pontos (cruzamentos 
com os eixos do plano Re(g(z)) x Im(g(z))) precisam ser calculados com precisão. 
Geralmente, um mero esboço do mapeamento é suficiente. 


Exemplo 3.5 Considere a função racional g(z) = 1/(2+0.5)(z—2) e os contornos fechados 
A, Be Č como mostrados na Figura 3.1. A função g(z) não tem nenhum zero e tem dois 
polos que são indicados por “x” na mesma figura. Ela também indica com “o” os zeros da 
função A(z) = 0,6 + g(z) cujos polos são os mesmos que os de g(z). 

Por simples inspeção verificamos que, para a função g(z), temos 


Ney Nys] contorno A 
gas No Nas contorno B 
Naso No 2 contorno C 
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Re(2) 


Figura 3.1: Contornos fechados 


-i 0.3 -0.6 04 0.2 0 0.2 0.4 0.6 0.3 


Re(g(z)) 


Figura 3.2: Mapeamentos 


enquanto que para a função h(z) temos 


N.=2 Npc l contorno A 
h(z): < N:z=0 Np=1 contorno B 
Ne Ny contorno Č 


A Figura 3.2 mostra os mapeamentos dos contornos 4, B e C obtidos com a função g(2), 
bem como coloca em evidência os pontos (0;0) e (—0,6;0). Levando em conta os sentidos 
dos percursos, o número de voltas em torno da origem (0; 0) é determinado, ou seja 


1 —1 contorno A 
z, Acarg(g(z)) SL sl contorno B 
i —2 contorno Č 


sendo que em todos os três casos, como não poderia ser de outra maneira, a igualdade 
(3.16) é verificada. Neste exemplo, fica evidente que a maior dificuldade para a verificação 
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do Princípio da Variação do Argumento, reside na determinação correta do mapeamento 
da curva fechada através da função g(z). Como fica claro, para funções racionais, essa 
dificuldade depende basicamente do contorno que se deseja mapear. 

Para verificar a igualdade (3.16) para função h(z), não é preciso determinar os mapea- 
mentos dos contornos fechados A, Be C com h(z). De fato, como h(z) e g(z) diferem entre si | 
de uma quantidade real constante, os mapeamentos dos mesmos contornos fechados, através 
de g(z) e h(z), são idênticos a menos de uma translação do eixo imaginário correspondente 
aquela constante real. Portanto, com os mesmos mapeamentos da Figura 3.2, obtemos 


3.3 Matrizes e Determinantes 


Embora já tenhamos manipulado vetores no capítulo anterior quando descreve- 
mos um sistema, dinâmico através de suas equações de estado, retomamos aqui esse 
conceito. Vetor é uma coleção de n escalares, denominados componentes, que as- 
sumimos estarem dispostos em coluna. Assim, x € R” indica um vetor com n 
componentes reais enquanto que x € C” indica um vetor com n componentes com- 


1 l contorno À plexas. O vetor linha x’ € R” é o transposto do vetor x € R” enquanto que x” Ee C” 
— Acarglh(z))=4 —1 contorno B é o vetor conjugado transposto de x € C”. E claro que se x € R” é um vetor real 
2T O contorno C 


então 1º = «q € R”. Um operação particularmente importante envolvendo dois 


e ma n, n P 
s etores de mesmas dimensões y € C” e x € C” é o chamado produto escalar 
onde o número de voltas em torno do ponto (—0,6;0) para cada contorno fechado é deter- vetor y p 


minado, novamente, por simples inspeção. E Ê 
De forma geral, ao fazermos o mapeamento de g(z), podemos verificar a validade (z, y) 3 Lib = 4 d (3.18) 
da igualdade (3.16) para qualquer função do tipo h(z) = a + Bg(z) coma e ReB 
0 € R, pois a variação do argumento de h(z) na origem do plano Re(h(z)) x Im(h(z)) 
pode ser obtida avaliando-se a variação do argumento de g(z) no ponto —a/B + j0 
do plano Re(g(z)) x Im(g(z)). 
De fato, para mostrar a validade deste procedimento, devemos avaliar a variação 
do argumento de g(z) no ponto —a/8 + j0 do plano Re(g(z)) x Im(g(z)). Ou seja, 
devemos avaliar, neste plano, a variação do argumento do vetor (z) com origem em 
—a/B + j0 e extremidade em g(z), ou seja d(z) = g(z) + a/B. A partir da relação 


Observe que para vetores reais, (x,y) = y x = x'y = (y, x) e que (x,y) = 0 indica que 
os vetores x € R” ey € R” são ortogonais. Este produto escalar induz a chamada 
norma Euclidiana que é dada por ||x||? = (x, £) = x'z. 

Matriz é uma coleção de nm escalares denominados elementos, dispostos em 
linhas e colunas. A notação A € R”*” indica que A é uma matriz com todos os 
elementos reais dispostos em n linhas e m colunas. Os números n e m indicam 
suas dimensões e ai; indica o elemento genérico da posição (i, j) comi <i<ne 
1<jy<m. Amatriz B = A'é denominada matriz transposta e é obtida pela simples 
conversão de linhas em colunas, ou seja, o elemento genérico da matriz transposta 
é dado por bij = aji. Matrizes podem ser multiplicadas por escalares e, sob certas 
condições, podem também ser somadas, multiplicadas e invertidas. 

-~ Algumas operações envolvendo matrizes só são definidas para a classe de matrizes 
quadradas, caracterizadas por terem o mesmo número de linhas e de colunas, isto é 
n=m. Uma matriz quadrada A € R”*” só pode ser invertida se o seu determinante 
não for nulo, ou seja se det(A) Æ 0. 

Um vetor v € R” pode ser multiplicado por uma matriz quadrada 4 € R?*?, 
resultando em um novo vetor de mesma dimensão Av. Alguns vetores são especiais, 
“ao serem multiplicados por uma matriz resultam em vetores colineares aos primeiros. 


Esses vetores são chamados de autovetores. A equação nas variáveis (À, v) com À € C 
ev#0 et” 


aell) = arg(g(z) + a/B) 
= arg((Bg(z) + 0)/6) 
= arg(h(z)/£) (3. 


concluímos que se 6 > 0 então arg(g(2)) = arg(h(z)) e, por outro lado, se B < 04 
então arg(&(z)) = arg(h(z))+7. Em ambos os casos, os argumentos de p(z) e de h(z) 
são iguais ou diferem de uma constante, o que não altera o número de voltas dadas 
em torno do ponto de interesse —a// + j0. Por sua importância, neste contexto, O 
ponto —a/8 + j0 é denominado ponto crítico. 

Em seguida passamos a estudar alguns aspectos importantes relacionados a ve- 
tores, matrizes e determinantes que envolvem, em especial, o cálculo de zeros e polos 
de funções racionais e a caracterização de matrizes simétricas por meio dos sinais 


dos seus autovalores. 


(A — Aju =0 (3.19) 
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permite calcular o autovetor v e o autovalor À a ele associado. Como se procura 
por soluções não triviais v Æ O de (3.19), os autovalores são dados pelas soluções da 
equação algébrica 


das matrizes localizadas nas diagonais principais. O teorema de Silvestre pode ser 
diretamente obtido pela aplicação da igualdade (3.21) para o caso particular carac- 
: erizado por A=Te D = I, o que leva a det(]I — BC) = det(I — CB). Outras 
propriedades muito usadas dos determinantes são det(A7!) = 1/det(A) para A não 
“singular e det(A’) = det(A). Finalmente, é importante citar que o determinante de 
uma matriz pode ser calculado pelo produto de todos os seus autovalores, ou seja 


A(X) = det(M — A) = 0 (3.20) 


denominada equação característica de A. Trata-se de uma equação algébrica de grau 
n com coeficientes reais, assim sendo, admite n e somente n raízes em C. Portanto, 
uma matriz A € R?” tem n e somente n autovalores, contando as suas multi- 
plicidades. Para cada A € C assim determinado, calcula-se o autovetor associado . 
através de (A — A)v = 0. Como este sistema de equações lineares admite, por cons- 
trução, infinitas soluções, pode-se adotar a normalização |lv|| = 1. Nota-se que, em 
geral, a determinação dos autovalores e dos autovetores de uma matriz exige rotinas 


n 


det(A) = | [A4 (3.23) 


i=l 


Algumas funções são importantes para o estudo de sistemas dinâmicos. Esse é, 
A . Å 3 ° / , o 
certamente, o caso da função exponencial et : R — R”*” definida através da série 


pe a (3.24) 


q! 
i=0 


numéricas. 

Sendo V uma matriz não singular, é interessante determinar a relação entre os 
autovalores e os autovetores das matrizes A e VAV. Multiplicando a equação 
(AI — VAV )u = 0 à esquerda pela matriz V obtemos (AI — Aju = 0 onde 
v = Vu mostrando que as duas matrizes têm os mesmos autovalores e que seus 
autovetores estão relacionados por v = Vu. À operação V-tAV é denominada 
transformação de similaridade. Em muitos casos, a matriz V pode ser determi- ET sê 
nada para que A = V-!AV tenha uma estrutura particular, por exemplo, uma Ee = >, lt) 
matriz diagonal formada pelos autovalores de A. Essa estrutura é conveniente dt 
para estudar várias propriedades dos determinantes como por exemplo a igualdade | | o Men | (3.25) 
det(AB) = det(A)det(B), que é válida para quaisquer matrizes quadradas de mes- 
mas dimensões. Essa propriedade, por sua vez, permite estabelecer a igualdade 


que sempre converge para todo t € R. A partir desta definição, podemos determinar 
a sua derivada em relação ao tempo 


sendo que a última relação revela que qualquer matriz comuta com a sua exponencial, 
isto é, Ae“ = e4tA. Uma outra função importante, nesse mesmo contexto, é a 
função racional C(sI — A) B + D : C —> C com ARM Be RR cer Me 
DER. Essa função pode ser escrita na forma equivalente 


A Bl. E 
det e bo É det(A)det(D — CA~ B) 


— det(D)det(A — BD”!C) (3.21) N(s) 


D(s) 


Císl -AJ!B+D = (3.26) 


onde as matrizes indicadas têm dimensões compatíveis e A e D são não singulares. 


De fato, calculando os determinantes de ambos os lados das igualdades onde D(s) = det(sI — A) é o polinômio característico de A. Por outro lado, com a 


A B I 0 A B relação (3.21), obtemos 
E a E Er J 0 D-CA`B [sI-A -B | 
= | 
T BD”! E us BD O 0 ; det C D == det(sT = Ajdet(D + C(sI — A) B) 
"10 q C D (re 


= N(s) | (3.27) 
obtemos imediatamente as relações (3.21), tendo em vista as estruturas triangulares 


[ “sendo que a segunda igualdade decorre de (3.26). Isto mostra que os dois polinômios, 
das matrizes no lado direito de (3.22) cujos determinantes são os determinantes 


o : def E Ab : š . 
que definem uma função racional qualquer, podem ser escritos como determinantes 
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Lá 


simétrica Q € RrXn é sempre possível determinar os seus autovetores v; € Ru 
n satisfazendo 


de duas matrizes propriamente definidas. Os seus polos e zeros são os valores de 
s € C que tornam esses determinantes nulos. Finalmente, temos a função traço 
Tr(A) : R”*” — R definida para toda matriz quadrada por Tr(A) = 3. a; e que 
pode ser calculada através dos seus autovalores 


po filo i=5 


de tal forma que à matriz V = [vi +- un] € Rº*”, que tem como colunas os autove- 

tores de Q, seja uma matriz unitária. De fato, em consequência de (3.29) ela satisfaz 
` e ° = as / 2 e o 

V'V = I, o que implica em que V-t = V’. O cálculo da inversa de uma matriz 

unitária reduz-se à determinação de sua transposta. ? 

; ç io a , = nxn 2 . gpa 

Uma matriz simétrica Q € R é definida positiva, denotada por Q > 0, se 


THA) = $ X(A) (3.28) 


Essa função tem a propriedade bastante útil Tr(AB) = Tr(BA), válida para quais- | 
quer matrizes de dimensões compatíveis. º 
Uma classe importante de matrizes quadradas é a classe das matrizes simétricas. 
Uma matriz real Q € R"*X” é simétrica se os seus elementos são tais que qij = qji 
para todo 1 <1<mne 1<39<n. Ou seja, todos os seus elementos situados em 
posições simétricas em relação à diagonal principal são iguais, levando à condição De maneira similar podemos definir Q > 0 (semidefinida positiva), Q < O (definida 
Q = Q' para garantir que Q seja uma matriz simétrica. O lema seguinte estabelece negativa) e Q < 0 (semidefinida negativa). O lema seguinte fornece um teste que 
duas das mais importantes propriedades das matrizes simétricas. permite verificar se uma dada matriz simétrica satisfaz alguma destas definições. 


r'Qr>0, x£0ER” (3.30) 


Lema 3.2 Seja E R Xn uma matriz simétrica. As duas afirma 0es seguintes são 
g 
verdadeiras: 


P x š E / . 
Lema 3.3 Seja Q e Rº*” uma matriz simétrica com autovalores A, , An. Às 
seguintes afirmações são verdadeiras: 


1. Todos os seus autovalores AM," „An São reais. 1. Q >0 se e somente se ` > 0, , Àn >0 
. ° E 9 9 ° 


2. Todos os seus autovetores \V1,'*' Un são reais e autovetores associados a na 
n i tvi, E j 2 Q> 0 se e somente se A 20,:::,An Z 0. 
autovalores distintos são ortogonais entre st. 


= R 3. Q<0 Sã 
Prova : Multiplicando Qu = Av à esquerda por v” obtemos vo Qu = Mvv. Poar q se e somente se Ay <0, An < 0. 


outro lado, considerando que a matriz Q é simétrica, calculando o conjugado daquela 
expressão, obtemos v” Qu = Xv" v, o que implica em À = À*. Desta forma, À € R 


J: Q<0seesomenteseA <O, +: , An <0. 


Prova : Com a matriz V = [v1 +- Un] E€ R”*” construída com os autovetores asso- 
ciados aos respectivos autovalores temos 


como requer a primeira parte do lema. 
Como À € R temos v € R” solução de (AI — Aju = 0. Por outro lado, con- 
siderando Qu; = Avi e Qu; = Ajvj dois pares de autovalores e de autovetores, mul- 
tiplicando a primeira igualdade por v; e a segunda por vui, obtemos vjQu:i = NUGUi V'QV = V'|Qu == Qu l 
e Qui = Ajuti. Calculando o transposto da primeira igualdade e levando em - = V'Vdiag(A,,---,An) 


conta que Q é uma matriz simétrica, temos v;Qu; = Aviv; à qual, devido à segunda = A (3.31) 
igualdade, implica que (A; — Aiulu; = 0. Portanto, A £ A; impõe que v;vj = 0, ou, i 
seja, os dois autovetores são ortogonais entre si. Isto prova a segunda parte do lema. onde A = diag(A,,:--,An). Lembrando que V é uma matriz unitária podemos 


E raV a / . / EST 

proposto. | | screver Q = VAV” e, assim, x'Qx = (V'2)'A(V'x) = y Ay onde y = V'z, ou seja 
Mesmo que dois ou mais autovalores sejam iguais, nada impede que 08 au- 

tovetores correspondentes sejam ortogonais entre si. Portanto, dada uma matriz 


n 
KONE >, Niy? (3.32) 


1=1 
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através das curvas em linhas tracejadas, verifica-se que as distâncias definidas por (3.33) dos 
pontos P, e Pù até a origem são bastante diferentes. g 


Os conceitos matemáticos introduzidos nesta seção são essenciais para se ter uma 
compreensão adequada daqueles que serão estudados em seguida. Em particular, 
os critérios de estabilidade para sistemas dinâmicos a tempo contínuo e a tempo 
discreto são, em grande medida, baseados no princípio da variação do argumento e na 
determinação de distâncias não Euclidianas expressas através de matrizes definidas 


positivas. 


34 Critérios de Estabilidade 


Figura 3.3: Curvas equidistantes 


Como V é uma matriz não singular, z O se e somente se y £% 0, a equação (3.32) 
implica que x'Qx' > 0 para todo x # O se e somente se À > 0,--: , Àn > 0,0 que 
prova a primeira parte deste lema. As demais são provadas de maneira similar. O 


Estabilidade é um dos atributos mais básicos de qualquer sistema de controle. 
De fato, em linhas gerais, a ação de controle em qualquer sistema dinâmico deve 
fazer com que, após um determinado intervalo de tempo que caracteriza o seu tran- 
sitório, ele opere segundo um perfil previamente estabelecido pelo sinal de referência. 
Desta forma, no decorrer do tempo, a sua saída deve apresentar um comportamento 
assintótico, de tal forma a eliminar o erro entre ela própria e o sinal de referência. 
Concluímos assim, nesse contexto bastante amplo, que um projeto adequado de um 
sistema de controle certamente vai requer que ele seja estável. | 


Uma matriz simétrica com autovalores positivos e negativos não se encaixa em 
nenhum dos casos estabelecidos no Lema 3.3. Trata-se de um matriz com sinal 
indefinido. Matrizes simétricas e definidas positivas são particularmente importantes 
por permitirem generalizar o conceito de distância Euclidiana. De fato, com Q = 
Q' € R"*” definida positiva, podemos definir a distância entre dois pontos quaisquer . 


x € R” e y € R” na forma E 
3.4.1 Caracterização 


d(x,y) = v (æ — y)V'Q — y) (3.33) 
É importante caracterizar o conceito de estabilidade para sistemas dinâmicos, 


através do comportamento de sua função de transferência no domínio da frequência 
e de sua resposta ao impulso no domínio do tempo. 


onde nota-se que d(x, y) = 0 se e apenas se x = y e d(x,y) > 0 para todo z + y € R?. 
Para Q = I obtemos a distância Euclidiana caracterizada pelo fato de que o lugar 
geométrico dos pontos equidistantes da origem x = O é uma superfície esférica. No 


caso geral, com I o referido lugar geométrico torna-se uma superfície elíptica. ças a ; 7 
aR GF SG p E Definição 3.3 (Estabilidade) Um sistema a tempo continuo com função de trans- 


“ferência H(s) é assintoticamente estável se todos os polos de H (s) estiverem locali- 
zados na região Re(s) < 0. 


Exemplo 3.6 Com a matriz simétrica 
1 — 
e=[ ai a] 
que é definida positiva, como atestam seus autovalores {0,6972; 4,3028 }, definimos a distância 
(3.33) entre dois pontos quaisquer no plano R2. A Figura 3.3 mostra os pontos P; e P que | 


estão situados a uma mesma distância da origem quando a distância é Euclidiana (os pontos 
equidistantes da origem estão situados sobre a curva em linha contínua). Na mesma figura, 


= Geralmente, omite-se o qualificativo assintoticamente mas continuamos a querer 
dizer que todos os polos devem pertencer ao semiplano esquerdo aberto complexo, 
isto é Re(s) < 0. Concluímos imediatamente da definição de estabilidade que se 
H(s) é estável então o eixo imaginário jw sempre pertence ao seu domínio. Ou, em 
particular, que a origem s = 0 também é um elemento do seu domínio, fazendo com 
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que o teorema do valor final possa ser aplicado para se obter e todos estão na mencionada região do plano complexo. Como era de se esperar, a 
g har. 


ificação de que uma determinada função de transferência é estável é muito menos 
verl es ° 2 s 
do ponto de vista numerico, do que calcular todos os seus polos. 


lim A(t) = lim sH(s)=0 (3.34) 


a istosa, ç los 
a Se o sistema em estudo for definido pela sua função de transferência H(s) = 
N(s)/ D(s), a sua equação característica A(s) = D(s) = 0 é uma equação algébrica 
2 Jl N , 


de grau n com coeficientes reais. Da mesma forma, para um sistema em malha 


Isto é, a resposta ao impulso de qualquer sistema estável tende à zero no decorrer 
i 
do tempo. Ademais, decompondo H (s) em frações parciais obtemos | 


a | fechada, os seus polos são raízes de 1 + C(s)G(s) = O que ao ser ng a 
pe a à cterística A(s) = D(s) + KN (s) = 
H(s) = Ds e CE (3.35) i + KH(s) = 0 faz com que a sua equação cara (s) (s) 
k=1 i=1 


também seja uma equação algébrica de grau n com coeficientes reais. Portanto, 
m Ja 


j a pos ss | 3 p temos 
onde pk é o seu k-ésimo polo com multiplicidade my e ng é o número de polos 


distintos de tal forma que 31,2, my = n que é o grau do polinômio denominador de 
H(s). A transformada de Laplace inversa de H(s) fornece a resposta ao impulso | 


A(s) = y TE (3.39) 
1=0 


dad 1 | onde normalmente se introduz, sem perda de generalidade, a normalização an = 1. 
= ; ” ~ / ° o ° . ~ 

h(t) = > ` m ePkt (3.36) Salvo expressa menção em contrário adotamos, daqui em diante, esta normalização. 
k=1 i=1 (i= 1)! 


O lema a seguir dá uma condição necessária, mas não suficiente, para que as raízes 
, , de (3.39) estejam localizadas no semiplano esquerdo complexo. 
a qual permite verificar que, para todo t > 0, a 

t Lema 3.4 Uma condição necessária para que todas as raízes de A(s) = O estejam 
A)| < 00, / hlr)ldr < oo (3.37) localizadas na região Re(s) < 0 é que a; > 0,i = 0,- , (n — 1). 

0 

ou seja, módulo da resposta ao impulso e a sua integral são funções limitadas no 
tempo. Esta última propriedade tem uma implicação interessante, considerando 


Ir(t)| < R a entrada limitada para todo t > 0 e y(t) a saída do sistema em estudo, 
temos 


Prova: O polinômio A(s), com todas as suas raízes na região Re(s) < 0, pode ser 
fatorado na forma 


| | (5° + 20;s + (o; + w3 )) (3.40) 


ais / h(r)r(t — 7)dr 


“onde À; > 0 são suas raízes reais e —0j + Jwj com Oj > 0 e w; > 0 são suas raizes 
complexas conjugadas. Como todas as parcelas de primeira e de segunda ordens em 
(3.40) têm coeficientes positivos, o mesmo ocorre com O A(s). o 


< R | "near (3.38) 
O 


válida para todo t > 0. Portanto, um sistema estável produz uma saída limitada 
como resposta a qualquer entrada limitada. Essa é uma forma equivalente de se 
caracterizar a estabilidade desta classe de sistemas dinâmicos. 

Para concluir se um sistema a tempo contínuo é ou não estável é necessário saber 
se todos os seus polos estão localizados na região Re(s) < 0 do plano complexo. É 
claro que essa verificação não requer o cálculo exato de todos os polos uma vez que a 
localização exata de cada um deles não é importante, sendo apenas relevante saber 


Como já foi dito, infelizmente, essa condição é apenas necessária. Para validar 
esta afirmação, basta achar um contra-exemplo. A equação algébrica de terceiro 
grau s3 + s2 + 485 + 340 = 0 tem todos os seus coeficientes positivos mas duas de 
suas raízes que são {—5, 2+ j8} estão fora da região de interesse Re(s) < 0. Por este 
motivo, a seguir, estudaremos critérios expressos em termos de condições necessárias 
esuficientes para assegurar a estabilidade assintótica de uma função de transferência 
com equação característica da forma (3.39). 


—— a 
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3.4.2 Critério de Routh-Hurwitz 


A tabela de Routh só pode ser calculada inteiramente se todos os elementos 
da primeira coluna forem diferentes de zero. Durante a construção da tabela, a 
ocorrência de um elemento nulo na primeira coluna de uma determinada linha requer 


Foi elaborado no final do século XIX, a partir de contribuições de dois cientistas as , 
um tratamento especial. Dois casos especiais devem ser considerados : 


que são homenageados com a denominação. O critério requer certo esforço para ser 
provado mas, em contra-partida, é extremamente simples de ser aplicado. Ganhou. 
assim, grande importância até os dias atuais. Ele se baseia na construção de uma | 
tabela chamada Tabela de Routh associada à equação algébrica (3.39), dada a seguir: 


e Todos os demais elementos da linha são nulos : Neste caso, o polinômio 
A(s) é divisível pelo polinômio gerador da linha anterior A(s). A linha nula é 
substituída pela linha gerada por A'(s). 


e Algum dos demais elementos da linha não é nulo : Neste caso, substitui- 
se o elemento nulo por e > 0, determina-se a tabela limite para e > 0. 


Tendo em vista o primeiro item do Teorema 3.1, se algum caso especial ocorrer então 
alguma raiz da equação algébrica A(s) = 0 estará localizada na região Re(s) > 0. 
Neste caso, certamente, a função de transferência em estudo não será assintotica- 
mente estável. Mesmo na eventual ocorrência de algum caso especial, o segundo 
item do Teorema 3.1 continua válido o que permite determinar o número de raízes 
localizadas na região Re(s) > 0. Passamos agora à resolução de alguns exemplos 
ilustrativos. 


(3.41) 


sendo que as duas primeiras linhas são construídas com os coeficientes de A(s) e 
qualquer linha subsequente é determinada a partir das duas anteriores com a regra 


bi = (dpois = nômades a 5 ; 
a. 5 (aÃ a E (3.49) Exemplo 3.7 Para o polinômio A(s) = s? + 45º + 5s + 2, a tabela de Routh é dada por 
bs = 


É fácil notar que podemos multiplicar uma linha por um número positivo sem al- 
terar o resultado. Essa propriedade pode ser adotada para simplificar os cálculos. 
Ademais, quando nenhum elemento da primeira coluna for nulo (situação que será 
tratada oportunamente), a determinação da tabela de Routh é simples e envolve 


Como tedos os elementos da primeira coluna são positivos, todas as raízes de A(s) = 0 estão 


i localizadas no semiplano esquerdo complexo. De fato, as raízes são {—2; —1; —1}. E 
apenas operações elementares. 


Nesse exemplo, todos os elementos da primeira coluna não são nulos e, assim, O 
Teorema 3.1 se aplica de imediato. Em contraste, no caso do exemplo dado a seguir, 
“ocorre uma linha nula que caracteriza o primeiro caso especial. O exemplo seguinte 
ilustra a ocorrência de um elemento nulo na primeira coluna, com algum outro não 
nulo na mesma linha, caracterizando o segundo caso especial. 


Teorema 3.1 Considere que a tabela de Routh foi obtida para a equação algébrica 
A(s) = 0. As seguintes afirmações são verdadeiras: 


1. Todas as raízes estão situadas na região Re(s) < O se e somente se todos os 
elementos da primeira coluna da tabela de Routh forem positivos. 


"Exemplo 3.8 Para o polinômio A(s) = st + 3sº + 3s? + 3s + 2, a tabela de Routh fica 


2. O número de raízes situadas na região Re(s) > O é igual ao número de trocas 
de sinal nos elementos da primeira coluna da tabela de Routh. 


O primeiro item deste teorema é conhecido como critério de Routh-Hurwiz pois é 
uma condição necessária e suficiente para assegurar que um determinado sistema. 
dinâmico seja estável. 
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Como não há nenhuma troca de sinal na primeira coluna, nenhuma raiz de A(s) = 0 se 
encontra no semiplano direito complexo. As raízes de A(s) = 0, localizadas sobre o eixo 
imaginário também são raízes de A(s) = 0. De fato, as raízes são {—2; —1; £5}. m 


Exemplo 3.9 Para o polinômio A(s) = s’ — 3s + 2, a tabela de Routh fica 


Como há duas trocas de sinal na primeira coluna, duas raízes de A(s) = 0 estão localizadas 
no semiplano direito complexo. De fato, as raízes são {—2; 1; 1}. o 


No exemplo dado a seguir, ilustramos a aplicação do critério de Routh-Hurwitz 
para estudar a estabilidade de um sistema cujo polinômio característico depende 
de um parâmetro real desconhecido. O objetivo é determinar todos os valores do 
referido parâmetro de tal forma a assegurar que todas as raízes da equação carac- 
terística estejam localizadas no semiplano esquerdo complexo. 


Exemplo 3.10 Deseja-se determinar os valores de k € R de tal forma a assegurar que 
todas as raízes de A(s) = s* + 683 + (13 + K)s? + (12 — 2K)s + (4+ s) estejam localizadas no 
semiplano esquerdo complexo. A partir do Teorema 3.1 basta construir a tabela de Routh 


S 1 1l3+rk 4+R 
s’ 3 6- 4 

s? 33 + 4K 12 + 3K 

s! | 81 — 9K — 2r? 

s0 


4+K 


e impor que todos os elementos da primeira coluna sejam positivos, o que leva ao intervalo 
—4 < k < 4,5. Embora não seja pedido, vamos estudar os dois valores extremos. Para 
k = —4 todos os elementos da primeira coluna são positivos à exceção da linha sº que é 
nula. Como A(s) = 85s e A'(s) = 85 > 0 uma das raízes é s = 0 e as demais têm parte real 
negativa. Para x = 4,5 os elementos da primeira coluna são positivos exceto aquele da linha 
st que é nula. Como A(s) = 5152 + 25,5 = 0 e A'(s) = 102s concluímos que todas as raízes 
têm parte real negativa à exceção das raízes de A(s) = 0, isto é +j1/v2, as quais também 
são raízes de A(s) = 0. O 


Tentamos enfatizar, através do Exemplo 3.10, que o critério de Roth-Hurwitz 
é uma ferramenta bastante eficaz para determinar o conjunto de todos os contro- 
ladores, de uma certa classe, que estabilizam um determinado sistema dinâmico. 
Neste sentido, vamos considerar novamente a estrutura básica de controle da Figura 
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2.8 com H(s) = 1 e cujos polos da função de transferência em malha fechada F(s) 
são as raízes da equação característica em malha fechada 


1I+C(s)G(s) =0 (3.43) 


onde G(s) é a função de transferência em malha aberta dada e C(s) é a função de 
transferência do controlador a ser projetado. Se o controlador C(s) for escolhido 
como um elemento da classe PID ou Atraso / Avanço, ele é completamente definido 
através de três parâmetros reais. Portanto, como a equação algébrica (3.43) depende 
destes mesmos parâmetros, a estabilidade do sistema em malha fechada pode ser 
imposta fazendo com que a primeira coluna da tabela de Routh seja positiva. Assim 
procedendo, todos controladores da classe escolhida, que estabilizam o sistema em 
malha fechada são determinados. 


Exemplo 3.11 Vamos considerar novamente o motor de corrente contínua já tratado no 
Exemplo 2.1, cuja função de transferência em malha aberta é 

1 
G(s) = —; 
(s) 14s2 + 15s +2 


Na estrutura em malha fechada, desejamos considerar a classe de controladores PI, com 
função de transferência C(s) = kp + k;/s onde kp > 0 e k; > 0, de tal forma que a equação 
característica em malha fechada (3.43), re-escrita como 


Als) = 148º E kO a a0 


tenha todas as suas raízes localizadas no semiplano esquerdo complexo. A tabela de Routh 
fica na forma 


14 
15 ki 

30 + 15kp — 14k; 

e assim O < k; < 1,0714k, + 2,1429 assegura que a sua primeira coluna seja positiva e, por 

consequência, estabelece a estabilidade do sistema em malha fechada. Devemos finalmente 

observar que kp = 0 e k; = 0,25 como já tínhamos utilizado anteriormente, faz com que o 

sistema em malha fechada seja estável. A 


O critério de Routh-Hurwitz, como originalmente desenvolvido, se restringe ao 
estudo de estabilidade de sistemas dinâmicos a tempo contínuo. No entanto, ele 
pode ser generalizado para estudar a estabilidade de sistemas a tempo discreto. 


Definição 3.4 (Estabilidade) Um sistema a tempo discreto com função de trans- 
ferência H(z) é assintoticamente estável se todos os pólos de H(z) estiverem locali- 
zados na região |z| < 1. 
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Em outras palavras, para que um sistema a tempo discreto seja estável todos os 
polos de sua função de transferência devem estar localizados no interior do círculo 
unitário. Entretanto, existe uma transformação, denominada transformação bilinear 
que mapeia os pontos do círculo unitário nos pontos do semiplano esquerdo complexo 
e vice-versa. De fato, essa transformação, definida na forma 


E nt ii e (3.44) 


Zeca, E 
coloca em evidência que se com um polinômio de ordem qualquer A(z) determi- 
narmos Amod(s) = A((1 + s)/(1 — s)), então todas as raízes de A(z) = O se situam 
no interior do círculo unitário se e somente se todas as raízes de Amoa o l-0 
se situarem no interior do semiplano esquerdo complexo. Portanto, aplicando o 
critério de Routh-Hurwitz em Amoals) = 0, todas as conclusões sobre as suas raízes 
em relação ao conjunto {s € C : Re(s) < 0} serão idênticas àquelas das raízes de 
A(z) = 0 em relação ao conjunto (ze C : |z| <1}. 


Exemplo 3.12 Desejamos verificar se todas as raízes da equação algébrica A(z) = 0, onde | 


A(z) = zł — 62º + 11,252º — 7,252 + 1,5, estão no interior do círculo unitário. Por simples 
substituição, verificamos que A((1 + s)/(1 — s)) = O é equivalente à equação algébrica de 
quarto grau Amod(s) = 278! — 4,58? — 7,582 + 0,55 + 0,5 = 0. Calculando a tabela de Routh 
para esta equação temos 


E 27 =o 0,5 

s’ sA 5 0,5 

se —4,5 0,5 A(s) = —4,5s2 + 0,5 
5 | O05 

s? 0,5 


Como ocorrem duas trocas de sinal na primeira coluna, duas raízes de Amoa(s) = O estão 
localizadas no semiplano direito complexo. Duas raízes de A(s) = 0 ou seja s = +1/3 
também são raízes de Amod(s) = 0. Portanto, duas raízes de A(z) = 0 estão localizadas fora 
o círculo unitário. Ademais, duas delas são z = 1/2 e z = 2 obtidas a partir da transformação 
bilinear aplicada às raízes de A(s) = 0. As raízes de A(z) = 0 são {1/2; 1/2; 2; 3}. o 


Em conclusão, o critério de estabilidade de Routh-Hurwitz tem uma grande 
importância no estudo de sistemas dinâmicos lineares. Além de ser uma condição 
necessária e suficiente para estabilidade, a sua implementação numérica através da 
tabela de Routh é simples e só depende de operações elementares. Embora tenha 
sido desenvolvido para sistemas a tempo contínuo, ele pode ser também aplicado a 
sistemas a tempo discreto a partir da transformação bilinear. 
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34.3 Critério de Nyquist 


O critério de estabilidade de Nyquist foi desenvolvido na primeira metade do 
século XX para sistemas lineares a tempo contínuo, muito embora possa ser usado, 
sem grandes modificações, para a análise de estabilidade de sistemas lineares a tempo 
discreto. O critério de Nyquist pode ser visto como um critério frequencial, pois sua 
aplicação depende exclusivamente da resposta em frequência de uma determinada 
função de transferência e do princípio da variação do argumento. O critério de 
Nyquist se aplica a uma equação algébrica A(s) = 0 de grau n com todos os seus 
coeficientes reais da forma (3.39), fatorada como A(s) = D(s) + KN (s) = 0 com 
k #0. Retomando a notação H(s) = N(s)/D(s), é claro que as raízes de A(s) = 0 
são também raízes de 


1 +xKxH(s)=0 (3.45) 


L 


pois 1 + sH(s) = A(s)/D(s). Sendo dada uma equação algébrica A(s) = 0, é 
sempre possível escrevê-la na forma D(s) + nN'(s) = 0 com «s + 0. Entretanto, os 
polinômios N(s) e D(s), bem como o escalar x # 0 € R não são únicos. Eles devem 
ser determinados de tal forma que a ordem de D(s) seja maior ou igual que a ordem 
de N(s) e que as raízes de D(s) = 0 sejam conhecidas ou possam ser facilmente 
calculadas. 

Adotamos o seguinte procedimento: Com uma curva fechada C sobre a qual 
não se encontra nenhum polo da função H(s), fazemos o mapeamento da H(s) e 
determinamos a variação do argumento de H(s) no ponto crítico —1/kK + j0, isto é 


1 | 
Naa z, Acarg(H(s)) (3.46) 


lembrando que Neri tem sinal algébrico positivo se o sentido do percurso de ČC 
e de seu mapeamento coincidem e negativo caso contrário. Como por hipótese 
conhecemos todas as raízes de D(s) = 0 podemos determinar Np, o número de polos 
de 1+«H (s) que se encontram no interior de C. É importante lembrar que isso pode 
ser feito, pois nenhum polo de H(s) e, portanto, de 14+«H(s) estão localizados sobre 
C. Como o princípio da variação do argumento estabelece que Nori = N; — Ny; 
determinamos | 


N, = Norit + Ny (3.47) 


que é o número de zeros de 1 + «H(s) e, portanto, o número de raízes de A(s) = 0 
que se encontram no interior de C. Em outras palavras, este procedimento permite 
determinar o número de raízes da equação A(s) = 0 que se encontram no interior 
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Figura 3.5: Mapeamento da curva C 
Figura 3.4: A curva C no plano s 


~ O mapeamento da curva Č pode ser decomposto em três partes. A primeira 
* corresponde ao segmento do eixo imaginário definido por s = jw com w > 0. O 
mapeamento deste segmento é dado por H (jw) para todo w > 0, ou seja pela resposta 
em frequência de H(s). A segunda parte corresponde ao semicírculo s = |sle/2s com 
|s| > œ e Zs € (1/2, —n/2) que é mapeado em um único ponto do eixo real pois 
= o limite limjs,o0 H (5) é zero quando a ordem do denominador for estritamente 
= maior que a ordem do numerador ou é a relação entre os coeficientes dos termos 
de maior grau quando a ordem do denominador e a ordem do numerador forem 
" iguais. Finalmente, a terceira parte corresponde ao segmento do eixo imaginário 
“s=-jw com w >0. O mapeamento correspondente é dado por H(—jw) para todo 
w > 0. Porém, como H(—jw) = H(jw)* o seu mapeamento é o complexo conjugado 
daquele do primeiro segmento, ou ainda, é obtido traçando-se a imagem espelhar do 
" mapeamento do primeiro segmento em relação ao eixo real. É sempre importante 


| ter em mente que, sendo C uma curva fechada, o seu mapeamento através de H(s) 
“também será uma curva fechada. 


de uma curva dada. A escolha adequada de C permite concluir que todas as raízes 
dessa equação estão localizadas, por exemplo, no interior do semiplano esquerdo ou 
no interior do círculo unitário do plano complexo. 

Para estudar a estabilidade de sistemas a tempo contínuo, podemos escolher 
a curva fechada C, ilustrada na Figura 3.4, que envolve todo o semiplano direito 
complexo. Se algum polo de H(s) estiver localizado sobre o eixo imaginário ela deve 
ser ligeiramente alterada para que ele esteja dentro ou fora dela. Esse aspecto será 
ilustrado a seguir através de alguns exemplos. 


Teorema 3.2 Todas as raízes da equação algébrica A(s) = O estão localizadas no 
semiplano esquerdo complexo definido por Re(s) < 0 se e somente se o mapeamento 
da curva fechada C dada na Figura 3.4 for tal que Nerit + Np = Q. 


Prova : Fazendo o mapeamento da curva C com a função H(s) e contando o 
número de voltas em torno do ponto crítico —1/« + j0, concluímos pelo princípio da 
variação do argumento que o número de raízes no interior de C é N; = Nerit + Np. 
Portanto, como por hipótese Neri + Np = 0,0 número de raízes de A(s) = 0 
no semiplano direito, incluindo o eixo imaginário é nulo. Ou seja, todas elas se 
encontram no semiplano esquerdo complexo. | E 


m inplo 3.13 Para aplicar o critério de Nyquist na equação algébrica de 32 grau A(s) = 
s7 + 4s° + 5s +4 = 0, primeiramente ela deve ser escrita na forma padrão 


2 


TGFH 


0 


Esse teorema, conhecido como critério de estabilidade de Nyquist permite algu- 
mas conclusões importantes. Se os polos de H (s) estiverem no semiplano esquerdo 
complexo então Np = O. Neste caso, o Teorema 3.2 exige que Neri = 0, ou seja, O 
mapeamento de H(s) não pode envolver o ponto crítico. 


s raízes de D(s) = (s + 2)(s + 1)º estão fora de C e assim N, = 0. O mapeamento de 
o ponto crítico —1/2 + 50 ilustrados na Figura 3.5 indicam que Nera = O. Portanto, 
E 0, todas as raízes de A(s) = 0 estão situadas no semiplano esquerdo complexo. Para 
nfirmar esse resultado, podemos aplicar o critério de Routh-Hurwitz na mesma equação. 
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Figura 3.7: Mapeamento da curva C 


indica duas trocas de sinal e permite a mesma conclusão anterior, ou seja, duas raízes de 


A tabela de Routh 
| A(s) = 0 situam-se no semiplano direito complexo. E 


| Exemplo 3.15 Considere novamente uma equação na forma padrão 


2 
i (205º + 10) ii 


com todos os elementos da primeira coluna positivos, leva à mesma conclusão. Poderíamos 
(s + 2)2(s — 1)? 


também aplicar o critério de Nyquist com uma curva C composta pelo eixo imaginário e 
um semicírculo de raio infinito que envolve o semiplano esquerdo complexo. O mapeamento 
de Ĉ com H(s) = 1/D(s) é o mesmo que o mapeamento de C pois lim|s oo H(s) = 0 e, 
assim, RER — 0. Entretanto, agora, todas as raízes de D(s) = 0 estão dentro de Ĉ e assim 
Np = 3. Consequentemente, N; = Nerit + Np = 3 e a conclusão é a mesma, ou seja, todas 
as raízes de A(s) = 0 estão situadas no semiplano esquerdo complexo. C 


“Duas raízes de D(s) = 0 estão dentro de C e, assim, Np = 2. O mapeamento de C com H (s) 
eo ponto crítico 1 + J0 ilustrados na Figura 3.7 indicam que Neri = —1 pois o sentido de 
percurso de C e do seu mapeamento não são os mesmos. Como N, = 1, uma raiz de A(s) = 0 
situa-se no interior do semiplano direito complexo. Para A(s) = st +28? — 23s? —4s—6 = 0 

a primeira coluna da tabela de Routh | 


Exemplo 3.14 Considere a equação já na forma padrão 


(s+5) = 
(s2 +s+ 1D(s + 2)(s + 1)? 


Como as raízes de D(s) = O estão fora de C então Np = 0. O mapeamento de C com 
H(s) e o ponto crítico —1 + 90 ilustrados na Figura 3.6 indicam que Neri = 2. Portanto, 
N; = Nerit + Np = 2 raízes de A(s) = 0 situam-se no interior de C, isto é, no semiplano 
direito complexo. Por outro lado, podemos aplicar o critério de Routh-Hurwitz na equação 
A(s) = 8º + 58! + 108º + 1152 +85 +7 =0. A primeira coluna da tabela de Routh 


L 


apresenta uma troca de sinal e, portanto, como esperado, apenas uma raiz de A(s) 


. 3 e E 0 
situa-se no semiplano direito complexo. L- 


f aa q mente a curva fechada C da Figura 3.4 não pode ser adotada em todos 
“3 o casos. De fato, ela não pode ser adotada quando a função de transferência H(s) 
2 964 273 ? algum polo com parte real nula. Neste caso, o mapeamento não é possível 
Aara H (s) deixa de ser analítica em algum ponto de C e, além disso, não é possível 
s? 273 erminar Np pois um ou mais polos de H(s) não estão nem dentro, nem fora de 
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Figura 3.8: A curva Co no plano z 


C, mas sim sobre C. A solução é fazer contornos arbitrariamente pequenos para 
desviar dos polos que se situam sobre o eixo imaginário, mantendo fechada a curva 
resultante. A nova curva passará arbitrariamente próxima dos polos situados no 
eixo imaginário e, assim sendo, o mapeamento H(jw) terá módulo arbitrariamente 
grande. Este aspecto tem um tratamento numérico bastante difícil. 

Por outro lado, o critério de Nyquist trata a estabilidade de sistemas a tempo 
discreto sem nenhuma dificuldade. A primeira possibilidade, na qual o leitor já deve 
ter pensado, é aplicar a transformação bilinear na forma padrão 1 + «KH(z) = 0 para 
convertê-la em 1 + sHmoa(s) = O onde 


Hmod(s) = H(z) Lis (3.48) 


em seguida, o critério de Nyquist a tempo contínuo é aplicado em 1+ RE modais) = 0. 
A segunda, geralmente mais simples, reside em escolher uma curva fechada conve- 
niente para esta finalidade, como aquela ilustrada na Figura 3.8 que tem no seu 
interior todos os pontos do plano complexo tais que |z| < 1. É importante enfa- 
tizar que a estabilidade assintótica ocorrerá desde que todas as raízes de A(z) = 
D(z) + KN(z) = 0 estejam localizadas no interior de Co. 


“Corolário 3.1 Todas as raízes da equação algébrica A(z) = O, de grau n, estão 
localizadas no interior do círculo unitário definido por |z| < 1 se e somente se o 
mapeamento da curva fechada Co dada na Figura 3.8 for tal que Neri + Np =n. 


Prova : Fazendo o mapeamento da curva Co com a função H(z) e contando o 
número de voltas em torno do ponto crítico —1/« + j0, concluímos pelo princípio da 
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Figura 3.9: Mapeamento da curva Co 


variação do argumento que o número de raízes no interior de Co é Nz = Nerit + Np- 
Portanto, como por hipótese Neri t Np = n, todas as raízes de A(z) = 0 se encontram 
no interior do círculo unitário. a 


O exemplo dado a seguir ilustra esse resultado. Convém alertar que fazer o 
mapeamento da curva Co com H(z), geralmente não é uma tarefa muito simples. 
Mesmo nos casos em que H(z) tem poucos zeros e poucos polos, o cálculo do ma- 
peamento exige a implementação e o uso de uma rotina numérica. 


Exemplo 3.16 Considere a equação característica de um sistema a tempo discreto, na 


forma 
(z + 4) o 
E Dao IDO 


Duas raízes de D(z) = 0 estão no interior de Ce então N, = 2. O mapeamento de Co com 


H(z) eo ponto crítico —1 +90 ilustrados na Figura 3.9 indicam que Neri; = —2 pois o sentido 
de percurso de C, e do seu mapeamento não são os mesmos. Como N, = 0, nenhuma raiz 
de A(z) = 0 situa-se no interior do círculo unitário. c 


Finalmente, cabe novamente ressaltar que as características essenciais do critério 
de Nyquist aplicado a sistemas a tempo discreto permanecem inalteradas. Em par- 
ticular, o mapeamento de Co através de H(z) pode ser feito em duas partes. A 
primeira, referente a z = e“ com 0 < w < 7 é feita através da resposta em 
frequência da função de transferência, ou seja H(e1®). A segunda pode ser cal- 
culada por z = ei?” com 0 < w < 7 cujo mapeamento é H (e71). Porém, como 
H(e IS = H(e“)* o seu mapeamento é o complexo conjugado da primeira parte, 
que é obtido traçando-se a sua imagem espelhar em relação ao eixo real. Como no 
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caso a tempo contínuo, o critério de Nyquist pode ser aplicado a sistemas a tempo 
discreto tendo apenas em mãos a sua resposta em frequência. 


3.4.4 Critério de Lyapunov 


As primeiras ideias a respeito do que veio a ser conhecido como o critério de 
estabilidade de Lyapunov surgiu no final do século XIX, é bastante geral e se aplica 
a sistemas dinâmicos lineares ou não lineares, a tempo contínuo ou a tempo discreto, 
descritos através de suas equações de estado. A ideia central, simples e intuitiva, é 
dada a seguir. 

Um ponto x. € R” do espaço de estado de um sistema dinâmico é denominado 
ponto de equilíbrio se 


Que = ai) tr We (3.49) 


se a condição inicial for exatamente um ponto de equilíbrio, o sistema ali per- 
manecerá para todo t > 0. Sendo v(x) uma função que mede a distância de um 
ponto genérico x € R” no espaço de estado até um ponto de equilíbrio £e, se para 
toda condição inicial z(0) = zo a função v(x(t)) diminuir e, consequentemente, ten- 
der para zero no decorrer do tempo, então x. é globalmente assintoticamente estável. 
O critério de Lyapunov baseia-se na escolha de v(x) a partir de uma função distância 
e na imposição de que v(x(t)) seja uma função decrescente em relação a t > 0. 

Começamos nosso estudo com um sistema linear a tempo contínuo com repre- 
sentação de estado 


i(t) = Ax(t) (3.50) 


onde z(t) € R”. Nota-se imediatamente que xe = O é um ponto de equilíbrio que 
será único desde que a matriz 4 € R”?*” seja não singular. Escolhendo a função 
quadrado da distância até a origem v(x) = «'Px com P € R”*” simétrica definida 


positiva e derivando-a em relação ao tempo, obtemos 
ù = t'Pr+zx'Pá 
= g(A'P + PA) (3.51) 
onde a segunda igualdade em (3.51) foi obtida substituindo-se equação diferencial 
(3.50), que define o sistema dinâmico em estudo. Dada Q e R"*” uma matriz 


simétrica definida positiva, se for possível determinar P > 0 solução da chamada 
equação matricial de Lyapunov 


AP+PA=-Q (3.52) 
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então ù = —x'Qu < O para todo x # O € R”, fazendo com que v(x(t)) seja 
uma função decrescente em relação ao tempo. Ademais, como Q e P são matrizes 
definidas positivas, sempre existe um escalar a > 0 suficientemente pequeno tal que 
aP < Q. Portanto 


ù = —rQr 
< —aor' Pr 
< —au (3.53) 


permite a conclusão de que v(t) < e “v(0),Vt > 0, ou seja de que v(t) tende a zero 
e, da mesma forma por ser o quadrado da distância de qualquer ponto do espaço 
de estado até a origem, x(t) tende ao ponto de equilíbrio x. = O assintoticamente. 
Observe que quanto maior a > 0, maior é a velocidade com que x(t) se aproxima 
da origem. Por este motivo, o parâmetro 2/a > 0 fornece uma estimativa do tempo 
de estabilização do sistema (3.50), ou seja 


REA Se sas (3.54) 


onde A;(4) denota o j-ésimo autovalor de A, raiz da sua equação característica 
det(A! — A) = 0. Como a é um escalar positivo, a desigualdade (3.54) implica 
que todos os autovalores de A estão localizados no semiplano esquerdo complexo 
e também que 4 é uma matriz não singular, fazendo com que a origem seja o seu 
único ponto de equilíbrio. Por este motivo, é comum dizer que o sistema (3.50) é 
assintoticamente estável, ficando implícita a menção a respeito da unicidade do seu 
ponto de equilíbrio. 

Embora esteja fora do escopo deste livro, é possível mostrar que, em um deter- 
minado sentido, a melhor escolha para a > 0 ocorre com a”! = masi AR) 


onde P é a solução simétrica definida positiva da equação matricial de Lyapunov 
(3.52) calculada com Q = T. 


Teorema 3.3 O sistema dinâmico linear a tempo contínuo x = Ax é assintotica- 
mente estável se e somente se para Q > O dada, existir P > O solução da equação 
matricial de Lyapunov A'P + PA = —Q. 


Prova : Para provarmos a necessidade assumimos que o sistema (3.50) seja assin- 
toticamente estável. Uma solução (que na realidade é única) da equação matricial 
de Lyapunov é 


OO 
P= | aroen (3.55) 
O 
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uma matriz simétrica positiva definida com autovalores {0,1499; 0,9421; 3,7205}. Portanto, 
todas as raízes de A(s) = 0 estão localizadas, como já sabemos, no semiplano esquerdo 
complexo. Determinamos ainda at = 3,17205 = Amaz(P) que satisfaz (3.54), sendo que os 
autovalores de A que também são raízes da equação característica A(A) = det(AI — A) = 0 
são dados por {—0,6522 + 91,0289; —2,6956). E 


De fato, calculando a sua transposta é imediato verificar que P é simétrica. Com 
£ 0 € R” um vetor qualquer temos 


Eres | i r(t) Qu(t)dt (3.56) 


onde z(t) = e2'£ é a solução de (3.50) com x(0) = £. Portanto, €' Pé > O decorre de 


Q ser uma matriz simétrica definida positiva. Por outro lado, com (3.55) vem a A a de peno aie 


o transitório de sistemas dinâmicos definidos na forma 


OO 
! E” I A't At AtN At ; 
AP+PA = / (A e^ Qe” + e" Re A) dt r(t) = Ar(t), (0) = xo (3.58) 
E r 4 EO F ult). = Crt) (3.59) 
E am onde xo € R” é uma condição inicial dada e y(t) € R” é a variável de saída. Por 
= lim ertoe — Q (3.57) hipótese, assumimos que este sistema seja assintoticamente estável de tal forma que 


, E | F l ; ult) — 0 quando t > œo. A qualidad a AN : 2a: 
que é exatamente a equação (3.52) pois como por hipótese a matriz A é assintotica- u(t) d d ade do seu transitório é medido pelo índice 


mente estável, o limite acima indicado é nulo. A prova da suficiência é mais simples. 
Se a equação matricial de Lyapunov admite uma solução simétrica definida positiva, 
o quadrado da distância v(x(t)) = r(t) Px(t) de x(t) € R” até a origem é uma 
função decrescente e, assim, limi-+00 x(t) = 0, o que demonstra que o sistema (3.50) 
é assintoticamente estável. o 


i= / “d (3.60) 


cujo valor, quanto menor, indica em linhas gerais um transitório de menor duração. 
Calculando a solução simétrica da equação de Lyapunov (3.52) com Q = C'C, que 
é dada por 
OO 
pe i edi (3.61) 
0 

notamos que, com A estável, P pode ser semidefinida positiva pois Q é uma matriz 
semidefinida positiva. Como a solução geral da equação diferencial determina a saída 
y(t) = Ce^t ro para todo t > 0, ao ser substituída em (3.60) fornece 


Este é o critério de estabilidade de Lyapunov aplicado ao sistema dinâmico linear 
a tempo contínuo (3.50). Um aspecto da equação matricial de Lyapunov (3.52) 
deve ficar bastante claro. Para aplicar o resultado do Teorema 3.3, considerando 
A € R"X?, como se deve procurar por uma solução simétrica, o número de incógnitas 
é n(n+1)/2 o que torna inviável o cálculo manual mesmo se tratando de uma equação 
linear. Além disso, tendo P em mãos, é preciso calcular todos os seus autovalores 
para atestar se eventualmente a solução encontrada é positiva definida. 


OO 
J a / rhet'C'Cettxodt 
0 


Exemplo 3.17 Vamos aplicar o critério de Lyapunov para estudar a estabilidade de um = 29Pzo (3.62) 
sistema com equação característica A(s) = s? +48? +55 +4 = 0, já considerada no Exemplo a l 
3.13. Uma possível representação de estado é definida por o ou seja, a solução da equação de Lyapunov permite determinar o valor do índice 
O 1 0 — | de desempenho J. Mais adiante veremos com aplicar este importante resultado na 
A= O 01 — síntese de controle de sistemas dinâmicos a tempo contínuo descritos através de sua 
caio i o equação de estado. 


Os resultados relatados para sistemas dinâmicos a tempo contínuo podem ser 
d ; ° o 
- adaptados, sem muitas diferenças, para o tratamento de sistemas a tempo discreto 
21250 1,3750 0,1250 definidos através da equação de estado 


P= | 1,3750 2,4688 0,3750 | o 
0,1250 0,3750 0,2188 | (k + 1) = Ax(k) (3.63) 


Com Q = I resolvemos numericamente a equação de Lyapunov, neste caso com 6 incógnitas, 
obtendo como solução 
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onde «(k) € R”. Como xe = 0 é um ponto de equilíbrio único no caso de [ — À 
ser uma matriz não singular, consideramos novamente o quadrado da distância até 
a origem v(x) = x'Px com P > 0. Com a equação de estado (3.63) obtemos 


vla(k + 1)) e(k)A'PAx(k) 
= a(k)(A'PA — P)z(k) + v(x(k)) (3.64) 


|l 


Portanto, dada Q > 0 € R”*”, se for possível determinar P > 0 soluçao da chamada 


equação matricial discreta de Lyapunov 
APA- P=-Q | (3.65) 
então v(z(k + 1)) — v(z(k)) = z(k)'Qr(k) < O para todo z(k) £ O € R”, fazendo 


com que v(x(k)) seja uma função decrescente em relação ao tempo, isto é para todo 
k e N. Com 8 > 0 suficientemente pequeno para poder satisfazer 6P < Q, a 
dependência de v(x(k)) diretamente de k € N se escreve 


v(k + 1) —ae(k) Qu(k) + v(k) 
— Ba(k) P(k) + v(k) 
(1 — polk) (3.66) 


implicando em que v(k) < (1 — B)*v(0) para todo k > 1. Como 0 <1-8<1 
concluímos que v(k) tende para zero quando k tende para o infinito. A mesma 
conclusão recai sobre x(k), pois v(x(k)) é o quadrado da distância de um ponto 
genérico do espaço de estado até o ponto de equilíbrio xe = 0. O valor de 5 define 
a velocidade com que x(k) se aproxima da origem no sentido de que 


Pd çã= A) peca (3.67) 


onde A;(A) denota o j-ésimo autovalor de A. Fica aparente pela desigualdade (3.67) 
que todos os autovalores de 4, que também são raízes da equação característica 
det(AI — A) = 0, devem estar situados no interior do círculo unitário. Esta mesma 
condição implica que 1 — A seja uma matriz não singular e xe = 0 o único ponto 
de equilíbrio do sistema linear (3.63). Novamente, em um determinado sentido, 
a melhor escolha para 1 > 5 > 0 ocorre com DU nas Ai(P), onde P é à 
solução simétrica definida positiva da equação matricial discreta de Lyapunov (3.65) 


calculada com Q = 1. 


IA IA 


Z 


Teorema 3.4 O sistema dinâmico linear a tempo discreto x(k + E Ax(k) é 
assintoticamente estável se e somente se para Q > O dada, existir P>0 solução da 
equação matricial discreta de Lyapunov A'PA-P=-—Q. 


3.4. CRITÉRIOS DE ESTABILIDADE 101 


Prova: Assumimos inicialmente que o sistema (3.63) seja assintoticamente estável. 


Uma solução (que na realidade é única) da equação matricial discreta de Lyapunov 
é dada por 


OO 


P=> AQA (3.68) 
k=0 
De fato, calculando a sua transposta é imediato verificar que P é simétrica, além 


disso, sendo é Æ O um vetor arbitrário no R” temos 
P | 
EPE=5 e(k/ Qu(k) (3.69) 
k=0 


onde x(k) = AFE é a solução de (3.63) com x(0) = E. Portanto, EPE > 0 decorre de 
Q ser uma matriz simétrica definida positiva. Por outro lado, com (3.68) vem 


APA-P = 5 aoa P AQA") 
k=0 
= lim AQA -Q (3.70) 
k— 00 


que é exatamente a equação (3.65) pois como por hipótese Á é assintoticamente 
estável, o limite acima indicado é nulo, provando assim a necessidade. A prova 
da suficiência é mais simples. Se a equação matricial de Lyapunov admite uma 
solução simétrica definida positiva, o quadrado da distância v(x(k)) = a(k)'Px(k) 
de z(k) € R” até a origem é uma função decrescente e assim limpo £(k) = 0,0 
que demonstra que o sistema (3.63) é assintoticamente estável. oO 


Este é o critério de estabilidade de Lyapunov aplicado ao sistema dinâmico a 
tempo discreto (3.63). As mesmas considerações que fizemos a respeito da dificul- 
dade de solução da equação de Lyapunov para sistemas a tempo contínuo também 
são válidas no presente caso. O número de incógnitas mantém em n(n + 1)/2 o que 
torna muito custosa a sua solução manual, mesmo para sistemas de baixa dimensão. 
A verificação de que P é definida positiva requer o cálculo de autovalores o que 
esbarra em dificuldades ainda maiores para n > 3. 

A qualidade do período transitório também pode ser avaliado através da solução 
de uma equação de Lyapunov discreta. Seja um sistema a tempo discreto assintoti- 
camente estável, definido pelas equações de estado 


xr(k+1) = Ark): x(0) = zo (3.71) 
ylk) = Celk) (3-72) 
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onde zo € R” é a condição inicial e y(k) € R” é a variável de saída. O critério usado 
é quadrático e leva em conta o afastamento da variável de saída do valor nulo, em 
cada instante de tempo k > 0, ou seja 


J =Y uk uh) (3.73) 


Como a solução geral de (3.71) fornece o valor da respectiva saída y(k) = CAF zo 
para todo k > 0, calculamos imediatamente 


J = 5 QA OCA" to 
k=0 
= xo P xo (3.74) 


onde P é a solução simétrica da equação discreta de Lyapunov (3.65) com Q = C'C, 
a qual pelo fato de Q ser uma matriz semidefinida positiva também pode ser apenas 
semidefinida positiva. Como foi dito anteriormente, em linhas gerais, os resultados 
de estabilidade para sistemas a tempo contínuo e a tempo discreto são bastante 
similares, a única diferença a notar reside nas duas equações de Lyapunov a serem 
devida e corretamente manipuladas. 


Exemplo 3.18 Considere um sistema a tempo discreto com equação característica A(z) = 
z3 — 0,502? + 0,25 = 0. Uma possível representação de estado é 


o q 0 
Ac 0o 0 1 
—0,25 0,00 0,50 


Com Q = 1 resolvemos numericamente a equação de Lyapunov, neste caso com 6 incógnitas, 
obtendo como solução 


1,2615 0,1231 —0,4923 
P=| 01231 22615 -0,123] 
-0,4923 —0,1231 41846 


que é uma matriz simétrica positiva definida com autovalores {1,1713; 2,2611; 4,2752}. Por- 
tanto, todas as raízes de A(z) = 0 estão localizadas no interior do círculo unitário. De- 
terminamos ainda 87! = Amar(P) = 4,2752 que satisfaz (3.67) sendo que os autovalores 
de À, que também são raízes da equação característica A(A) = det(AI — A) = 0, foram 
numericamente determinados e são dados por (—0,5000; 0,5000 + 50,5000-. E 
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Acabamos de estudar três critérios de estabilidade de sistemas dinâmicos lineares. 
Os três têm uma importante característica em comum. São baseados em condições 
necessárias e suficientes e, assim, são equivalentes entre si. Mas também têm suas 
características e particularidades próprias. O critério de Routh-Hurwitz é melhor 
adaptado para trabalhar diretamente com a equação característica, o critério de 
Nyquist depende da resposta em frequência e, finalmente, o critério de Lyapunov é 
mais adequado para se aplicado quando a representação de estado estiver disponível. 
A aplicação de cada um deles, no contexto mais adequado, depende de um apren- 
dizado que este livro tenta passar ao leitor. | 


3.5 Lugar das Raízes 


O lugar das raízes é uma técnica muito importante e muito usada em projetos de 
sistemas de controle, como aliás se verá nos capítulos seguintes. O objetivo é traçar 
no plano complexo todas as raízes de uma equação algébrica de grau qualquer, 
parametrizadas por um parâmetro real, ou de maneira mais específica, da forma já 
estudada anteriormente 

1+«KH(s)=0 (3.75) 


onde H(s) = N(s)/D(s). É claro que as raízes de (3.75) são soluções da equação 
algébrica A(s) = D(s) + KN (s) = 0. Algumas hipóteses devem ser introduzidas : 


e O polinômio N(s) com coeficientes reais tem grau m. O polinômio D(s) com 
coeficientes reais tem grau n > m. O coeficiente do termo de maior grau de 
cada um deles é unitário, permitindo que sejam fatorados na forma 


m 
N(s)= | |(s-2z:), D(9)=]| (3.76) 
i=1 
onde z; e p; são os zeros e os polos de H (s). 
e O parâmetro K € R pertence ao intervalo x € (0,00). 
O lugar das raízes é o traçado das raízes s;(x), i = 1,---,n da equação algébrica 
A(s) = 0 com coeficientes reais e grau n, para todo s € (0,00). Diz-se que o 


lugar das raízes tem n ramos, cada um deles corresponde a uma das raízes s;(K) 
para todo « € (0,00). Obter o lugar das raízes de forma exata requer resolver 
A(s) = 0 para todo « € (0,00). Portanto, e daí a sua importância, o seu traçado de 
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forma aproximada pode ser feito com bastante facilidade utilizando-se as regras de 
construção dadas a seguir. 

Seja s € C um ponto qualquer no plano complexo, com o qual determinamos as 
formas polares 


s-m = |es= zld", i=1; m (3.77) 
S— Pi |s — pilet, i=], n (3.78) 


e verificamos que este ponto s € C pertence a pelo menos um dos ramos do lugar 
das raízes para algum « € (0,00) se as seguintes condições forem simultaneamente 
satisfeitas: 


e Condição de módulo : 
[la [8 — &i| dl 


= — 3.79 
H=ils—-pil « 
e Condição de ângulo : 
DS pi- A=(0k+I)r,keZ (3.80) 
i=1 i=1 
Estas duas condições asseguram que H (s) = N(s)/D(s) = —1/k para algum valor 


de x € (0,00). A condição de módulo determina o ganho «k > 0 enquanto que a 
condição de ângulo impõe que o número complexo H(s) seja, na verdade, real e 
negativo como exige a equação H(s) = —1/k qualquer que seja x > 0. Observe que 
em (3.80), o valor de k pode ser qualquer número inteiro, fazendo com que (2k+ 1)r 
seja igual a m mais ou menos um número qualquer de voltas inteiras. 


Exemplo 3.19 Neste exemplo, vamos ilustrar a verificação das condições de módulo e de 
ângulo considerando o lugar das raízes de 


E 28 + 2 0 
fe — 
s(s + 2)(s + 0,5) 
Inicialmente devemos notar o ganho K = 2k para que a forma padrão seja obtida. A função 
de transferência H(s) tem um zero z1 = —l e três polos pı = 0, p2 = —0,5 e pa = —2. Para 
s = —1,5 + 2,09 a condição de ângulo fornece 


3 
di — D ora 


i=1 
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indicando que este ponto do plano complexo não pertence ao lugar das raízes. Entretanto, 
para s = —0,63 + 91,43 a mesma condição fornece 


o que mostra que este ponto pertence ao lugar das raízes. Pela condição de módulo, obtemos 


m IM- |s — r:l 8 — pi as 3,0 
|s — zıl 
e assim s = —0,63 + j1,43 são duas raízes de 1 + KH (s) = O para «x = 1,5 as quais, de fato, 
são dadas por {—0,6347 + j1,4265; —1,2306 }. Estes cálculos mostram que podemos verificar 
facilmente se um ponto do plano complexo pertence ou não ao lugar das raízes. A operação 
inversa, ou seja, a determinação de todos os pontos que o constituem só pode ser feita de 
maneira aproximada, como veremos em seguida. | o 


Passamos agora a expor detalhadamente seis regras que reputamos sejam as 
mais importantes para a construção aproximada do lugar das raízes de uma equação 
algébrica dada. Assumimos que a equação foi fatorada na forma (3.75) e que H(s) 
satisfaz as duas hipóteses já introduzidas. 


Lema 3.5 (Regra 1) Os n ramos do lugar das raízes começam nos polos p; com 
t = l,- n para kK — 0 e terminam nos zeros z; comi=1,:-:,m para K — 00. 


Prova : Considere a equação em estudo (3.75) escrita na forma D(s)+ «N (s) = 0. 
Fazendo «x — 0 as suas raízes tendem para as raízes D(s) = 0. Por outro lado, com 
a forma alternativa ” !D(s) + N(s) = 0, fazendo «K — oo as suas raízes tendem para 
as raízes de N(s) = 0. E 


Devemos observar que se n > m, existem n — m ramos cujas terminações não 
estão definidas pela Regra 1 pois para k — oco somente os m ramos que tendem aos 
zeros de H(s) são considerados. Esse importante aspecto é tratado pela Regra 2. 


Lema 3.6 (Regra 2) Sen > m, n—m ramos do lugar das raízes tendem para 
infinito assintoticamente an — m retas, todas com o mesmo coeficiente linear 


o = Diz Pi — Lies di (3.81) 


n-m 
e com coeficientes angulares 
(2k — 1)r 


n— m 


Ok = k=L (nm) (3.82) 
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è o © ~ o A o a2. nı , 1 no m $ 
Prova : Fazendo a divisão dos polinômios D(s) = X ;—oais* por N(s) = > jo bist 
obtemos os dois primeiros termos do polinômio divisor 


D(s) E E 
DEL = SM A (amo = bma) 

E a Meteo os dora (3.83) 
sendo que a segunda igualdade decorre de (3.81) em conjunto com uma propriedade 
bem conhecida de equações algébricas que atesta as igualdades a,-1 = — > my Pi € 
bm-1 = — > ;-1 Zi: Assim sendo, para |s| —> oo podemos adotar a aproximação 

H(s) = : 3.8 
(5) = (ES oem) (3.84) 


de tal forma que, com ela, a equação (3.75) admite as n — m raízes 


s=0+ Yk" R/(—1) (3.85) 


Por outro lado, lembrando que "-%/(—1) = e!?:, onde 0) são os n— m ângulos dados 
em (3.82), obtemos 


s=0 + Yr I, k=1, -n-m (3.86) 


No plano complexo, fazendo x — oo, verifica-se que estas n — m raízes tendem 
assintoticamente para n — m retas que passam pelo ponto o + j0, cada uma delas 
com coeficiente angular 0,. Isto prova o lema proposto. E 


Como os polos e zeros de H(s) são conhecidos, as duas primeiras regras, per- 
mitem determinar com muita facilidade o comportamento do lugar das raízes para 
k > 0 suficientemente pequeno e suficientemente grande. Mesmo no caso bastante 
comum em que n > m, as retas assíntotas também são determinadas com muito 
pouco trabalho adicional. De fato, elas têm o mesmo coeficiente linear e os seus 
coeficientes angulares dividem o arco 27 em n — m partes simétricas. 


Lema 3.7 (Regra 3) Todos os pontos do eixo real que estejam localizados à es- 
querda de um número ímpar de polos e zeros pertencem ao lugar das raízes. 


Prova : De fato, considere s um ponto qualquer do eixo real. Para polos e zeros 
complexos e seus conjugados temos 0; + d; = Yi + Y; = 27. Por outro lado, para 
polos e zeros reais situados à esquerda de s temos 9, = Yp = 0. Finalmente, para 
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polos e zeros reais situados à direita de s temos Gg = ya = T e, quando forem em 
número ímpar, a condição de ângulo será satisfeita. o 


Novamente, como todos os zeros e os polos de H(s) são conhecidos, a deter- 
minação dos segmentos do eixo real que pertencem ao lugar das raízes é imediata 
a partir da aplicação da Regra 3. A regra número 4 é bastante geral e consoli- 
da propriedades já conhecidas das equações algébricas, bem como dos critérios de 
estabilidade anteriormente estudados. 


Lema 3.8 (Regra 4) Como todos os coeficientes dos polinômios N(s) e D(s) são 
reais, as seguintes propriedades são válidas : 


e O lugar das raízes é simétrico em relação ao eixo real. 


e O cruzamento do lugar das raízes com o eixo imaginário jw pode ser calculado 
a partir da aplicação do critério de Routh ou do critério de Nyquist. 


Prova : A primeira propriedade decorre do fato de que se s € C é raiz de uma 
equação algébrica com coeficientes reais então o mesmo ocorre com o seu conju- 
gado. A segunda propriedade simplesmente indica que os critérios de estabilidade 
mencionados permitem identificar raízes imaginárias puras. E 


Lema 3.9 (Regra 5) Se em um ponto s E€ C um ou mais ramos do lugar das raízes 
se cruzam então 


D(S)N'(s) — N(s)D'(s) = 0 (3.87) 


Prova : Para um determinado valor de k > 0, se em um ponto s € C um ou 
mais ramos do lugar das raízes se cruzam então D(s) + KN (s) = O admite soluções 
múltiplas. Por este motivo D'(s) + &N'(s) = 0, da qual eliminado-se o valor de 
k, obtemos o resultado desejado. Observe que se trata apenas de uma condição 
necessária. Assim sendo, podem existir raízes da equação (3.87) onde não ocorre 
cruzamento de ramos. E 


Pode-se verificar que a equação (3.87) é equivalente a H'(s) = 0, sua forma mais 
compacta. Por outro lado é importante salientar que o grau da equação algébrica 
(3.87) én +m -— 1 e, assim, para n+ m > 3 a sua solução pode requerer o uso de 
uma rotina numérica. 


Lema 3.10 (Regra 6) Os ângulos de saída dos polos e os ângulos de chegada nos 
zeros podem ser determinados pela condição de ângulo. 
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-5 .—&4 -3 ea =l 0 | 


Figura 3.10: Lugar das raízes no plano s 


Prova : Como a condição de ângulo é uma das condições para que um ponto 
pertença ao lugar das raízes, nada há a ser provado. Entretanto, saliente-se que 
essa regra parece óbvia, mas a sua aplicação precisa ser muito bem entendida. Por 
exemplo, considere um polo qualquer pı e um ponto s € C arbitrariamente próximo. 
A reta entre s e pı se confunde com a reta tangente ao ramo que passa por pj. Como 
s e pı estão localizados arbitrariamente próximos um do outro, os ângulos œ;, i Æ 1 
e pi são conhecidos. A condição de ângulo permite determinar 6, e, portanto, o 
angulo de saída do polo pı que é definido pela reta tangente. O 


Essas regras devem ser aplicadas em diversos exemplos para serem bem enten- 
didas. É importante salientar que o cálculo e o traçado exatos do lugar das raízes 
de uma equação algébrica certamente requerem o uso de rotinas numéricas para 
determinar as raízes de uma equação algébrica de grau arbitrário. Aqui, o objetivo 
é outro, qual seja, o de obter um traçado aproximado mas suficientemente preciso 
para ter uma boa ideia a respeito do comportamento de um sistema dinâmico em 
relação à variação de um de seus parâmetros. Como veremos mais adiante, o lugar 
das raízes é uma ferramenta poderosa para o projeto de sistemas de controle em 
malha fechada. 


Exemplo 3.20 Considere a equação característica de um sistema a tempo contínuo já 
colocada na forma padrão 

| 2 
(s+2(s + 1)2 


A Figura 3.10 mostra o lugar das raízes parametrizado em R = 2k € (0,00). Note que 
H(s) tem n = 3 polos indicados pelo símbolo “x” e nenhum zero (m = 0). Observe as 
três assíntotas definidas pelo coeficiente linear o = —4/3 e pelos três coeficientes angulares 


l+«K O 
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Figura 3.11: Lugar das raízes no plano s 


02, = (7/3;m7;—7/3+. Os dois ramos correspondentes às duas raízes complexas tendem 
rapidamente (com a variação de R) para as duas assíntotas. Note também o ramo no eixo 
real à esquerda de um número ímpar de polos (três). E 


Exemplo 3.21 A Figura 3.11 mostra o lugar das raízes para 


(s+5) o 
C a LC 


parametrizado em « € (0,00). Os n = 5 polos de H (s) estão denotados por “x” enquanto o 
seu único zero (m = 1) por “o”. O lugar das raízes tem 5 ramos sendo que n—m = 4 tendem 
para o infinito através das assíntotas com coeficiente linear o = O e coeficientes angulares 
04, =(m/4;37/4; -n/4; -37/4). O ramo restante tende para o zero localizado na posição 
zı = —5. Aplicando a condição de ângulo em um ponto s € C arbitrariamente próximo do 


polo pı = —0,5000 + 70,8660 temos 
11º — (dy + 90º + 60º + 60º + 30º) = — 180º 


1+kk 


que determina ġı = —49º. Finalmente, para calcular o cruzamento com o eixo imaginário, 
aplicamos o critério de Nyquist. O mapeamento da curva C por H (s) é dado na Figura 3.6 e 
foi tratado no Exemplo 3.14. Determinando numericamente o cruzamento do mapeamento 
com o eixo real, obtemos we = 0,92 [rad/s] e Re(H(jwc.)) = —1,34 e, assim, o valor de K > 0 
para que duas raízes sejam imaginárias puras, isto é, s = +40,92 é dado por Ke = 1/1,34 = 
0,75. Como já foi comentado anteriormente, os valores de we e de Ke são também facilmente 
determinados através dos diagramas de Bode. E 


Exemplo 3.22 Deseja-se esboçar o lugar das raízes com « € (0,00) para um sistema a 
tempo discreto com equação característica já colocada na forma padrão 1 + KH (z) = 0, ou 
seja 


(z +4) 
(z — 1/2)(z + 1/2)(2 + 3/2) 


l+k =) 


; 
l 
i 
E 
E 
É 
f 
f 

| 

Ê 
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Figura 3.12: Lugar das raízes no plano z 


É claro que as regras para a construção do lugar das raízes não mudam. Entretanto, agora 
o ponto de cruzamento com o eixo real deixa de ter interesse e deve ser substituído pelo 
ponto de cruzamento com o círculo unitário. Esse lugar das raízes tem n = 3 ramos, um 
deles termina no zero e os outros dois tendem às assíntotas com coeficiente linear o = 1,25 
e coeficientes angulares 02, = (7/2; 7/2). Observe os dois segmentos no eixo real. Existe 
também um ponto de cruzamento de ramos que pode ser obtido resolvendo-se H'(z) = 0, 
ou seja, 22º + 13,52? + 122 — 0,6250 = O que fornece as soluções ( —5,6849; —1,1144; 0,0493}. 
Como os dois primeiros pontos pertencem a segmentos do eixo real, onde sabemos que 
não existe lugar das raízes, no ponto z = 0.0493 ocorre um cruzamento de dois ramos. 
Finalmente, vamos determinar o cruzamento com o círculo unitário, mostrado em linha 
pontilhada na Figura 3.12, aplicando o critério de Routh. Inicialmente, com a transformação 


bilinear determinamos 


sie aasa OC A 
Hmoals) = H(z) |;=: = (s — 5)(s + 3)(s + 0,3333) 


e a equação característica modificada 1 + «E moa(s) = 0, que pode ser escrita na forma 
(1 + 85)sº — (1,667 + 29.338)s? + (34,67% — 15,67)s — (5 + 13,336) = 0 


Com a tabela de Routh 


s 1+8% 34,67% — 15,67 
ge — (1,667 + 29,336) —(5 + 13,33%) 
st | (K2 — 0,50% — 0,0342) /(1,667 + 29,33%) 

s® —(5 + 13,33%) 


verificamos que para k = 0 a primeira coluna tem uma troca de sinal indicando que uma 
das raízes da equação original está fora do círculo unitário. Para x > 0,5610 ocorrem 
três trocas de sinal na primeira coluna, indicando que três raízes estão fora do círculo 
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unitário. Para «s = 0,5610 a linha st se anula e a linha s? determina as raízes sobre o eixo 
imaginário s = +70,8298 que correspondem aos pontos de cruzamento com o circulo unitário 
z = (1 + s)/(1 — s) = 0,1844 + 50,9828 segundo ilustra a Figura 3.12. o 


Os últimos exemplos mostram que os critérios de estabilidade de Routh-Hurwitz 
e o lugar das raízes se complementam no sentido de dar ao usuário informações 
precisas a respeito da localização de raízes da equação característica de sistemas 
a tempo contínuo ou a tempo discreto, segundo a variação de um parâmetro real 
positivo. Portanto, estes procedimentos e os conceitos nos quais eles são baseados 
devem ser entendidos com bastante profundidade e precisão. 

Como já foi dito, as regras para esboçar o lugar das raízes são invariantes para 
sistemas a tempo contínuo ou a tempo discreto. É claro que do ponto de vista 
de estabilidade, no primeiro caso, o importante são os eventuais cruzamentos com o 
eixo imaginário enquanto que, no segundo, a importância recai sobre os cruzamentos 
com o círculo unitário. Entretanto, aquelas regras mudam em algumas situações. 
Por exemplo, as regras para o traçado do lugar das raízes para a equação 


1- «KH(s)=0 (3.88) 


com « € (0,00) são diferentes daquelas apresentadas anteriormente. Fazer uma 
análise das diferenças existentes entre elas é um excelente exercício para consolidar 
o entendimento e o aprendizado deste tema. 


3.6 Redução de Modelos via Polos Dominantes 


Muitos sistemas dinâmicos são representados por equações diferenciais ou equa- 
ções a diferenças de ordem elevada. No caso linear, esses sistemas podem ser repre- 
sentados de forma equivalente através de suas respectivas funções de transferência. 
Neste contexto, coloca-se uma importante questão que se refere à possibilidade de 
aproximar as funções de transferência mencionadas por outras de ordens menores e, 
por consequência, menos complexas e mais adequadas para serem usadas em projetos 
de sistemas de controle. 

Considere a seguinte função de transferência de um sistema a tempo contínuo 
G(s) com n polos localizados no semiplano esquerdo complexo, isto é, G(s) é suposta 
ser assintoticamente estável. Desejamos determinar uma função de transferência 
aprorimada Gap(s) com r < n polos bem como avaliar o erro introduzido por essa 
aproximação. E claro que G(s) e Gap(s) podem apresentar zeros desde que seja em 
número menor ou igual aos dos seus respectivos polos. 
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A estratégia aqui considerada baseia-se no conceito de polos dominantes. De- 
compondo G(s) em frações parciais, assumindo por simplicidade que os seus polos 
sejam distintos entre si, temos 


n 


n 
G(s) = X — (3.89) 
RRS 
=l 
onde os polos são organizados de forma ordenada O > Re(pı) > --- > Re(pn) e 
a; E C para todo i = 1,:--,n. A ideia é reter no modelo aproximado os r polos 


mais lentos, isto é, mais próximos do eixo imaginário de tal forma a termos uma boa 
aproximação para o regime transitório. Assim sendo, adotamos 


P 
b; 
a ER 
ql 
onde 5; E€ C para i = 1,---,r são constantes a determinar. Neste sentido, alguns 


pontos devem ser ressaltados. Se um polo complexo for retido no modelo aproxi- 
mado, os mesmo deve ocorrer com o seu conjugado. Os coeficientes 6; associados a 
polos complexos conjugados devem ser complexos conjugados para que os coeficientes 
de Gap(s) sejam reais. Resta definir um critério que permita determinar os coefi- 
cientes de Gap(s), tendo em vista que a escolha trivial 8; = a; para todo i = 1,---,r, 
geralmente não leva a uma boa aproximação. Este aspecto será ilustrado, a seguir, 
através de um exemplo. | 

Como o transitório, de certa forma, já foi levado em conta ao retermos na função 
aproximada os r modos dominantes da função original, propomos que a escolha 
dos coeficientes 5; para i = 1,::-,r leve em conta o comportamento de G(s) e de 
Gap(s) em regime permanente para um conjunto de entradas previamente escolhidas. 
Adotamos as entradas com transformada de Laplace f(s) = 1/s* para k = 1,2,--- 
ou seja degrau unitário, rampa unitária etc., para as quais podemos determinar as 
respostas em regime permanente através de 


GR 60) 


5 5 


+ U(s) (3.91) 


onde U(s) tem os mesmos polos de G(s) e cuja transformada inversa desaparece no 
decorrer do tempo. Da mesma forma 


cls) CO), G0) 
S s2 


72 + R(s) (3.92) 
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onde a transformada inversa de R(s) também desaparece no decorrer do tempo. Em 
conclusão, para o conjunto de entradas adotadas, as respostas dependem exclusi- 
vamente de G(s) e de suas derivadas sucessivas calculadas em s = 0. Note que 
sendo G(s) assintoticamente estável, a origem (s = 0) pertence ao seu domínio e ao 
domínio das suas derivadas sucessivas. 

Esta discussão nos leva a propor a determinação dos parâmetros 5; € C para 
i=1,---,r, de tal forma que 


GW (0) = G™ (0), k=0,.-.,r—1 (3.93) 
sendo que estas r condições fazem com que as respostas em regime permanente da 
função de transferência original G(s) e de sua aproximação Gap(s) sejam idênticas, 
para as entradas f(s) = 1/s* com k = 1,---,r. Considerando (3.90), as derivadas 
sucessivas indicadas em (3.93) permitem escrevê-la na forma do seguinte sistema de 
equações lineares 


= —1 


po Pr pı G(0) 
: = = (3.94) 
aaO co ee! (r—1) 
que, ao ser resolvido, fornece os coeficientes 51,:::, bp. É importante notar que a 


matriz que aparece no lado esquerdo de (3.94) será composta por números complexos 
quando polos complexos forem retidos na função aproximada. Neste caso, como G(s) 
e as suas derivadas sucessivas calculadas em s = 0 são números reais, a solução de 
(3.94) fornecerá valores complexos conjugados para 61, , Br. 


Exemplo 3.23 Considere a função de transferência 


5 


Ag (s + I)(S2 +45 +5) 


com nenhum zero e com polos {—1; —2 + 5), cuja decomposição em frações parciais assume 


a forma | | 
2,0 1,25(1+39) 1,25(1-95) 


“(SAD s+2+j s+2-j 
A aproximação trivial de primeira ordem, obtida retendo-se o termo da decomposição em 
frações parciais correspondente ao polo dominante 
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Figura 3.13: Resposta ao degrau unitário 


é muito pobre pois para t > 0 suficientemente grande, a resposta ao degrau unitário de G(s) 
tende para 1 enquanto que a de Gap(s) tende para 2,5 acarretando assim um erro de 150% 
em regime permanente. Resolvendo (3.94), obtemos 


1 
(s+1) 
fazendo com que o erro em regime permanente seja nulo. Este exemplo bastante simples 


coloca em evidência, como dissemos anteriormente, que a escolha trivial de 61 = ay = 2,5 
não leva a um resultado satisfatório. o 


Gap(s) == 


Exemplo 3.24 Considere a função de transferência 


150(s + 1) 


G(9) = (57067725 +27 E 


que tem cinco polos pı = —1 + j, p2 = —1 — j, p3 = —2, pa = —5+93, Ps = —3 — 93 e um 
zero 21 = —1. As derivadas sucessivas de G(s) em s = 0 foram calculadas como sendo 


G(0) = 2,0833, GD (0) = —1,7361, GP (0) = —0,1157 


Para r = 2 os dois polos dominantes são pı = —1 + j e p2 = —1 — j, com os quais a solução 
do sistema linear (3.94) fornece 81 = 0,3472 — 51,7361 e 82 = 0,3472 + j1,7361, permitindo 
determinar a função aproximada de segunda ordem 

0,6944(s + 6) 

Cp) sro 
sł +2s +2 

Para r = 3, o polo dominante ps = —2 foi considerado com os dois primeiros. A solução do 
sistema linear (3.94) fornece a função de transferência aproximada de terceira ordem 


(s — 3,445) (s + 1,045) 


= —?2 314 
E a] 
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que é de fase não mínima. A Figura 3.13 mostra as respostas ao degrau unitário para G(s) 
em linha contínua e para as aproximações de segunda ordem em linha tracejada e de terceira 
ordem em linha pontilhada. Nota-se a boa qualidade de ambas as aproximações e que, em 
regime permanente, as três tendem para o mesmo valor fazendo com que os respectivos erros 
sejam nulos. E 


Tendo sido obtida uma função de transferência aproximada, é possível avaliar 
a sua qualidade calculando-se a resposta em frequência do erro de aproximação 


E(s) = G(s) — Gap(s) e verificando se 
max | E(jw)| < max |G(jw)| (3.95) 


onde se exige que o máximo módulo do erro de aproximação seja muito menor que 
o máximo módulo da função de transferência original, que se quer aproximar. É 
claro que se para um determinado valor de r esta desigualdade não se verifica, pode- 
se aumentar o seu valor e considerar uma aproximação de ordem mais elevada. É 
evidente que, assim procedendo, existirá uma certa ordem r < n para a qual a 
desigualdade (3.95) será satisfeita pois o seu lado esquerdo torna-se nulo para r = n, 
caso em que a função aproximada é a própria função original. 


3.7 Notas Bibliográficas 


Este capítulo contém todo o material que constitui a base matemática necessária 
para o bom entendimento dos capítulos seguintes. Ela está apresentada de maneira 
genérica e não de forma específica para tratar apenas problemas de projeto de sis- 
temas de controle como, aliás, é usual se ver literatura [14], [15], [25] e [30] entre 
outros. Inicialmente, introduz-se as funções de variáveis complexas, dando par- 
ticular atenção ao Princípio de Variação do Argumento, para em seguida serem 
introduzidos conceitos básicos de matrizes simétricas, material que pode ser revisto 
e complementado com [3], [21] e [28]. Mais além, os critérios de estabilidade são 
estudados com bastante profundidade, com ênfase nos sistemas a tempo contínuo 
mas generalizando os resultados para o tratamento de sistemas a tempo discreto. 
Em nossa opinião, a abordagem do tema é nova e contém generalizações que não 
estão presentes nos textos clássicos de controle. O critério de Lyapunov é intro- 
duzido, sobretudo, com vistas ao cálculo de critérios de desempenho quadráticos. O 
lugar das raízes é tratado com especial atenção às provas das suas regras básicas de 
construção. O capítulo termina com um importante assunto, a redução de ordem 
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de modelos dinâmicos lineares, que acreditamos ter tratado de forma simples e pe- | 
culiar, não encontrada na literatura clássica, tendo em vista os objetivos principais | 


do texto. 


3.8 Exercícios 


Exercício 3.1 Considere o sistema de controle representado na Figura 3.14. Estude sua 
estabilidade em função do ganho r E R, utilizando o critério de Routh e em seguida o critério 
de Nyquist considerando as seguintes funções de transferência: 


AN 


Hoe H ee) H 


H (s) 


Figura 3.14: Sistema em malha fechada. 


(+ +M o E pes S+3 Fe 
a) EO a sR ) G(s) s(s2 + 4s +5) (s) s+1 
b) doad n. - H(s)=1 d) G(s) = ! - 


cIa e 
s(s2 +2s +5)” s(s? + 2s + 10) ’ (8) s+8 


Exercício 3.2 Considere o sistema de controle com realimentação unitária representado 
na Figura 8.15. Estude sua estabilidade em função do ganho k € R através dos critérios de 
Routh e de Nyquist considerando as seguintes funções de transferência: 


de Gts 


Figura 3.15: Realimentação unitária. 


38. EXERCÍCIOS 


s+2 
s +10 


a) G(s) = 


1 
CESTO CER 
(s + 1)(s +10) 


) Ad = Te 7 100% +23 
s+1 

d) G(s) = a 
s+ 1 

e) A)= RE) 
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G o 1 
EDET 
o (1 + 10s) 
9) Cl) = 2051 +55 9) 
h) al) = =) 
= MEIO) 
essa 


(s + 2)(s + 10) 


Exercício 3.3 Considere as equações características de sistemas dinâmicos a tempo conti- 
nuo dadas a seguir. Determine no plano real k x À seus respectivos domínios de estabilidade. 


a) s(s+I)(s+O,5)+n(s+A)=0 
b) st +28 + ns +As+r=0 


Exercício 3.4 Considere o diagrama de blocos da Figura 8.16, onde k e À são parâmetros 


reais. 


Figura 3.16: Realimentação unitária com dois graus de liberdade. 


a) Determine no plano r x À a região de estabilidade para o sistema em malha fechada. 


b) Para À = O aplique o critério de Nyquist e determine todos os valores de k € R para 
os quais o sistema em malha fechada seja estável. 


Exercício 3.5 Determine o número de raízes da equação s* + 68º + 1052 — 2s — 15 = 0 
que estão localizadas no semiplano complexo definido por Re{s} < —1. 


Exercício 3.6 Supondo que a equação algébrica 


s(+ 10542) 4 (045) = 


represente a equação característica de um sistema a tempo contínuo, determine todos os 
valores de a > O tais que as suas raízes sejam assintoticamente estáveis. 
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Exercício 3.7 Considere o sistema de controle a tempo discreto representado na Figura 
8.17. Determine os valores de k tais que o sistema em malha fechada seja estável, para as 
seguintes funções de transferência e respectivos períodos de amostragem T dados a seguir. 


à y 
noi ué K - Gls) | - 


Figura 3.17: Realimentação unitária em sistemas a tempo discreto. 


a) G(s) = PEER = 0;1 [s] e T = 0,5 [s] 
b) G(s) = -rap T = 0,01 [s] e T= 0,1 fs] 


Exercício 3.8 Para cada uma das funções de transferência, no contexto de sistemas a 
tempo contínuo, dadas a seguir, obtenha sua representação de estado e, aplicando o critério 
de Lyapunov, conclua sobre sua estabilidade. 


10 10(s + 1) 


s2? +7s +10 e 


a) G(s) = E qu 
Go) Ss“ +982+3s+7 


Exercício 3.9 Para cada uma das funções de transferência, no contexto de sistemas a 
tempo discreto, dadas a seguir, obtenha sua representação de estado e aplique o critério de 
Lyapunov para concluir sobre sua estabilidade. 


z— 0,5 al 


ii o PR ae 


| z2 — z + 0,26 
Exercício 3.10 Considerando a equação característica 1 + KG(s) = 0, esboce no plano 
complexo o lugar das suas raízes, em função do ganho k E [0, +00), para as funções de 
transferência definidas a seguir. Utilize todas as regras possíveis. 


1 l 
) Ea Y Ad = Tr 243) 
s2 + 8s+ 20 s+2 
DOE a) o Co) = (Gy IX + 6s +10) 
© 10(s—1) — E 
Rc O er Eca VAO = Grs) 
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„a (s=1)(s=3) TE 
A e VEEE A 
s2 + 16s+ 73 s? 
) GO = Tor TS + Bs AT) 2 TIETE 
f Ja 25º + 6s + 90) e s(s — 2) 
pre) s(s2 + 4s + 13) A (s +3)(s +5) 


Exercício 3.11 Considere um sistema de controle a tempo contínuo com realimentação 
unitária, de acordo com a Figura 3.15. Esboce o lugar das raízes em função do ganho 
k > 0 para cada um dos seguintes valores de œ € {1/2;3/2;5}. Considere as funções de 
transferência em malha aberta, dadas a seguir, e verifique a influência do valor do parâmetro 
a em cada caso. 


o o 8+2 çć a gps sta _ 
a) G(s) = (s+1)%s+oa) AJ (s + 4)(s + 2)? 
b) G(s) = d) G(s) = e 


(s2 +2s +5)(s +a) 


(s + 4)(s2 + 4s + 13) 


Exercício 3.12 Considere a função de transferência de um sistema a tempo contínuo 


1 


O e O) 


Para os valores do parâmetro a € {1;4}, esboce no plano complexo o lugar das raízes da 
equação característica 1 + KG(s) = 0, em função do ganho «s € [0, +00). 


Exercício 3.13 A Figura 3.18 representa o diagrama de Bode de módulo assintótico de 
uma junção de transferência estável de um sistema a tempo contínuo de fase mínima, cujos | 
polos complexos têm fator de amortecimento £ = 1/4. 


20 logio 2 


20dB /dec 


I 
I 
(l 


lrad/s 


—60dB/dec 


Srad/s l6rad/s 


Figura 3.18: Diagrama de Bode em malha aberta. 


a) A partir de seu diagrama assintótico de módulo, determine a função de transferência 


G(s). 
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b) Escreva a expressão para a saída em regime permanente deste sistema para uma en- 
trada rampa unitária. 


c) Esboce o diagrama de Bode de fase de G(s). 


d) Calcule aproximadamente, via diagrama assintótico de módulo, o módulo da saída do 
sistema para a entrada u(t) = cos(12t). 


e) Considerando o sistema com realimentação unitária da Figura 3.15 e a função de- 
terminada no item a), estude sua estabilidade em função do ganho K, utilizando o 
critério de Nyquist. 


f) Para o sistema da Figura 3.15 e G(s) determinada no item a), esboce o lugar das 
raízes parametrizado pelo ganho «k > 0. 


Exercício 3.14 Considere um sistema de controle a tempo contínuo com realimentação 
unitária de acordo com a Figura 8.19 na qual a planta é representada pela função de trans- 
ferência 

| (s + 5)(s + 10) 


Ge s2(s + 2) 


Figura 3.19: Realimentação unitária. 


a) Considerando um controlador C(s) = k > 0, através do critério de Nyquist, determine 
os valores de k para os quais o sistema em malha fechada seja estável. 


b) Para o controlador do item anterior, esboce o lugar das raízes em relação ao parâmetro 
k > 0 e determine-o de modo que o sistema em malha fechada possua dois polos 
complexos conjugados com fator de amortecimento igual a O,70T. Utilizando uma 
rotina computacional, obtenha a resposta ao degrau para o sistema em malha fechada 
e discuta se é possível adotar uma aproximação de segunda ordem. 


c) Considerando um controlador integral C(s) = k/s com k > 0, refaça o item a) e 
verifique se é possível atender a especificação do item b). 


d) Se utilizarmos um controlador proporcional integral C(s) = k(s + 20)/s com K > 0, 
refaça os itens a) e b). 
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e) Suponha que o controlador proporcional integral do item d) deva ter um zero em 
s = —2, ao invés de em —20, a fim de cancelar o correspondente polo da planta. 
Neste caso, esboce novamente o lugar das raízes em relação ao parâmetro k > 0. 


Exercício 3.15 Um sistema de controle a tempo contínuo tem como equação característica 


em malha fechada 
TS+3 


s(82 +25 +2) 


Esboce o lugar das raízes desta equação característica para Y T > 0. 


Exercício 3.16 Considere o sistema de controle em malha fechada da Figura 3.20. 


Figura 3.20: Sistema de controle com realimentação não unitária. 


a) Esboce o lugar das raízes e determine k > O de tal forma que os polos dominantes 
tenham constante de tempo 1/3 [s]. 


b) Para «x calculado no item anterior determine a resposta ao impulso do sistema em 


malha fechada. 
c) Suponha que o polo em s = —12 da planta sofra alterações durante o funcionamento 
do sistema em malha fechada, resultando em seu deslocamento para s = —10. Para o 


valor de k calculado no item anterior e utilizando uma rotina computacional, compare 
as respostas ao degrau unitário para as duas condições de operação do sistema em 


malha fechada. 


Exercício 3.17 Considere o sistema de controle com realimentação unitária apresentado 


na Figura 3.21, no qual se assume k > O. Para cada uma das funções de transferência 
dejinidas a seguir 


E 1 
YGS) =e 
di s(š5 + Dio + 1) 


(s + 1)(s + 2)(s2? + 8s + 25) 
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HoH s H eo pf 
Figura 3.21: Realimentação unitária. 
H) O = Tra E 16 F GTT 
pede-se: 


c) 


d) 


e) 


T f) 


a) Esboce o lugar das raízes em função do ganho «k > 0. 


b) Determine k > 0 de maneira que os polos dominantes do sistema em malha fechada 


apresentem fator de amortecimento igual a 0,5. 


Para k determinado no item anterior encontre a saída para uma entrada degrau 
unitário. 

Determine uma função de transferência aproximada de segunda ordem para o sistema 
em malha fechada e compare seu tempo de estabilização e sua máxima sobre-elevação 
para uma entrada degrau unitário com os respectivos valores para o sistema em malha, 
fechada original. 


Esboce os diagramas de Bode para a função de transferência em malha fechada aproxi- 
mada e para a função de transferência em malha fechada original. Determine e com- 


pare ambas as faixas de passagem. 


Determine a função de transferência aproximada de segunda ordem para o sistema 
em malha aberta. Em seguida, através do lugar das raízes, determine o ganho Kap 
tal que os polos em malha fechada apresentem fator de amortecimento igual a 0,5 e 
determine sua resposta ao degrau unitário. Em seguida, utilize o ganho Rap calculado 
para controlar a planta G(s) original impondo uma entrada do tipo degrau unitário. 
Comente sobre a validade do resultado obtido. 


Capítulo 4 


Fundamentos de Projeto 


4.1 Introdução 


O objetivo central deste capítulo é discutir e analisar alguns procedimentos já 
bem estabelecidos e que foram propostos para projetar, com sucesso, diversos sis- 
temas de controle. Critérios de desempenho serão tratados novamente, porém, dando 
maior enfase aqueles expressos no domínio da frequência. Em seguida, os contro- 
ladores clássicos serão analisados sem muitos detalhes, mas deixando clara as regras 
de projeto para cada um deles. Este capítulo termina com dois projetos de interes- 
se prático, que foram incluídos para ilustrar as dificuldades que se deve enfrentar 
quando se deseja fazer projetos de controle para sistemas reais. 


4.2 Critérios de Desempenho 


No Capítulo 2, tivemos a oportunidade de tratar alguns critérios de desempenho 
a partir da resposta temporal de um sistema de controle cuja função de transferência 
em malha fechada tivesse sido aproximada por seus polos dominantes, de tal forma 
a ser escrita como F(s) = Fap(s) + Q(s), sendo Q(s) a parte desprezada e Fap(s) a 
função de transferência correspondente aos polos dominantes. . 

Considerando Fap(s) uma função de transferência estável, de primeira ou de 
segunda ordem, com Fap(0) = 0, os critérios de desempenho expressos em termos do 
valor de pico máximo e do tempo de estabilização da resposta ao degrau unitário 
foram convertidos em um conjunto Q C C. Se todos os polos de F(s), que são rale 
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da equação característica do sistema em malha fechada, estiverem localizados no 
interior de Q então o perfil ideal da sua resposta ao degrau unitário estará certamente 
atendido. Como vimos, não há nenhuma dificuldade para calcular o conjunto Q, 
assumindo a validade da aproximação de polos dominantes. O conjunto Q está 
situado no semiplano esquerdo complexo e impõe um limite mínimo sobre o fator 
de amortecimento e um limite máximo sobre a parte real das raízes da equação 
característica. 

Os critérios de desempenho no domínio da frequência se expressam através de 
duas características principais, a saber : 


e Valor de pico máximo : Corresponde ao valor do módulo da função de 
transferência calculada na frequência de ressonância wr de tal forma que 


Citar )| = max |F (jw)| (4.1) 


Como a função logaritmo é crescente o máximo acima indicado pode ser calcu- 
lado diretamente como sendo o valor máximo do diagrama de Bode de módulo, 
expresso em dB. 


e Largura de faixa : A largura de faixa, definida pela frequência W, é o 
menor intervalo de frequências da forma [0, W], tal que 


! 
i 


FOW) = zzl F00) (4.2) 


Assim sendo, para verificar esta relação no diagrama de Bode de módulo, basta 
determinar uma frequência W na qual o módulo da função de transferência 
esteja 10log1o(2) = 3 [dB] abaixo do seu valor em w = 0. 


Passamos agora a calcular essas duas quantidades para as aproximações de polos 
dominantes de primeira e de segunda ordens. No primeiro caso, considerando 


F(s) =- A - (4.3) 


com o > 0, imediatamente verificamos que o seu diagrama de Bode de módulo é 
uma função decrescente em relação à frequência, o que permite concluir que wr = 0 
e |F(jwr)| = 1. Por outro lado, simples substituição mostra, imediatamente, que 
W = o. Como a posição do polo real define a largura de faixa, quanto maior o, mais 
rápida será a sua resposta mas, em compensação, maior será a largura de faixa e O 
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sistema torna-se mais vulnerável à perturbações não modeladas como ruídos de alta 
frequência eventualmente presente na sua entrada. 
Adotando agora a aproximação de segunda ordem com polos complexos conju- 


gados 
ne 


F S) = tm A 
(5) s2 + 2éwns + w2 Ea) 
onde O < é < 1. Definindo a variável auxiliar a > 0 na forma a = w/wn, temos 


que 
1 


(1 — a) + j2év0] 
e a maximização indicada em (4.1) pode ser realizada de forma equivalente pela 
minimização do quadrado do denominador de (4.5) em relação a a 2 0, ou seja 


|F (jw)| = (4.5) 


RR: 2 
mina” — 2(1— 2 
nin ( Ja +1 (4.6) 
cuja solução é determinada derivando-se a função objetivo em relação a a e tendo 
o cuidado de levar em conta que a solução tem que ser não negativa. Assim proce- 
dendo, obtemos a solução ótima na forma 


1 — 2º ; 0O<£<1/V2 


da o 1/vV2<é<] So 


com a qual determinamos a frequência de ressonância wr = V Art € O correspon- 
dente valor máximo de pico em frequência. Para 1 / V2 < £< 1 temos wr = 0 e, con- 
sequentemente, maxw>o |F (jw)| = |F(j0)| = 1. Por outro lado, para O < & < 1/ V2 
calculamos- w; — 71 — 2wa que nos leva a maxy>o |F(jw)| = |F(jwr)| = H(6); 
onde 


1 
ficando claro que o valor máximo de pico depende exclusivamente do fator de 
amortecimento. Ademais, como d(£) é uma função decrescente, se determinarmos 
£; tal que (E) = dg então verificamos que para todo 1 J V2 > E > £q > 0 a desigual- 
dade ¢(£) < dg é satisfeita. Em outras palavras, qualquer fator de amortecimento 
maior ou igual a é, assegura que o pico máximo de |F(jw)| não ultrapassa o valor de 
$4. Impor um limitante superior no valor máximo de pico em frequência é o mesmo 
que impor um limitante inferior no fator de amortecimento. 

Passamos, agora, a calcular a largura de faixa, a qual, no presente caso em 
que |F(j0)| = 1 é caracterizada pela frequência w = W que satisfaz a condição 


e o 


i 
Í 
f 
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| N Im(s) 


sen” + (£q) 


m Re(s) 


—Omazx 


Figura 4.1: O conjunto Q 


IF (jw)? = 1/2. Considerando novamente a variável auxiliar e a igualdade (4.5), 
esta última condição se expressa na forma da equação a” — 2(1 — 2a — 1 = 0, cuja 
única solução não negativa fornece 


w = (0-2) 4 VT EA co (49) 


Como vemos, a dependência da largura de faixa com o fator de amortecimento é bas- 
tante complicada porém com valor médio muito próximo de um. Por este motivo, 
adotamos a aproximação W = wn o que torna à largura de faixa independente do 
fator de amortecimento. Note que para € = 1 / V2 a aproximação proposta torna-se 
exata. A partir deste resultado, podemos concluir que, para um mesmo fator de 
amortecimento, quanto maior a largura de faixa W, menor será o tempo de estabi- 
lização, fazendo com que à resposta temporal seja mais rápida. Em oposição, quanto 
maior a largura de faixa W, maior será a sensibilidade em relação à perturbações 
não modeladas (ruídos) presentes eventualmente na entrada do sistema. 

Estas especificações no domínio da frequência determinam um conjunto Q, onde 
as raízes da equação característica devem estar localizadas. De fato, com os parâme- 
tros (da, Wmin; Wmaz) que definem um limitante superior para o valor de pico e os 
valores máximo e mínimo para a largura de faixa, determinamos (£q, min; di 


através de (Eq) = Pq, Tmin = Wmin € Omas = Ea Wmax, bem como o conjunto Q C C 
ilustrado pela Figura 4.1. 
Se o polo s = —o € R de uma função de transferência de primeira ordem estiver 


no interior de Q então Wmin SO < EgW mar < Wmaz fazendo com que a sua largura 
de faixa esteja situada no intervalo especificado. Da mesma forma, se os polos 
complexos conjugados de uma função de transferência de segunda ordem estiverem 
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20 A 
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i 
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0 5 10 15 


Figura 4.2: Largura de faixa e resposta temporal 


no interior a N então Imin E Re(s) < Omar € é = |Re(s)|/|s| > é fazendo com 
que as exigências dos dois critérios de desempenho sejam atendidas. Os exemplos 
dados a seguir ilustram estes resultados teóricos. | 


Exemplo 4.1 Considere que o perfil da resposta em frequência definido pelos parâmetros 
(da, Wmin, Wmax) = (1,23; 0,30; 4,41) indicando que o valor máximo de pico não pode ul- 
trapassar 23% do valor em w = 0 e que a largura de faixa deve se situar entre os limitantes 
expressos em jrad/s|. Com d(&j) = 1,23 determina-se €& = 0,455 enquanto que com os dois 
outros parâmetros obtém-se Omin = 0,30 e Omaz = 2, que definem completamente o conjunto 
o da Figura 4.1. E muito importante observar que o limitante inferior —2 < —o im É 

limitar a sensibilidade do sistema quanto à presença de ruídos na sua entrada = T 


o 4.2 Consideramos duas funções de transferência de segunda ordem com polos 
Coni oR com fator de amortecimento € = 0,455. Foram determinadas adotando-se a 
aproximação W = wn com W, = 0,66 [rad/s] e W2 = 4,41 [rad/s]. 


0,4356 19,45 


O GE o E E Ci 
s2 + 0,6006s + 0,4356 * le 4,013s + 19,45 


o a o as larguras de faixa exatas foram calculadas como sendo 
na or p s| e Wo = 5,82 [rad/s], respectivamente. No lado esquerdo da Figura 4.2, 
: 5 Tane o diagrama de Bode de módulo de F; (s) em linha tracejada e de Fo(s) em linha 
a lado neto da mesma figura mostramos as respostas temporais de cada função 
P i rência para a entrada r(t) = 1 + 0,2sen(10t) para todo t > O que representa um 
| grau unitário com um ruído senoidal a ele sobreposto. Nota-se, perfeitamente, que aquela 
n a (s) tem uma resposta mais lenta mas que praticamente não é ad pelo 
a Ba contrário, aquela de maior faixa Fo(s) tem resposta mais rápida, sendo então 
astante afetada pela presença do ruído na sua entrada. E 
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1/MG 


Figura 4.3: Margens de fase e de ganho 


Em conclusão, os critérios de desempenho apresentados podem ser convertidos na 
determinação de um conjunto 92 C C e na exigência de que todos os polos da função 
de transferência F(s) estejam localizados no seu interior. Ou seja, todo s € C raiz 
da equação característica 1+C'(s)G(s) = O deve ser tal que s € Q. Isso é conseguido, 
determinando-se adequadamente a função de transferência do controlador C (s). 

Existem dois outros critérios de desempenho que são muito importantes não ape- 
nas pelos aspectos teóricos envolvidos mas também por serem usados em inúmeras 
aplicações práticas. São as chamadas margem de fase e margem de ganho. Nova- 
mente, o ponto central consiste em assegurar que um sistema em malha fechada com 
equação característica 1 + C(s)G(s) = O seja estável. Se possível, seja estável com 
alguma folga, isto é, com uma certa margem. 

Vamos imaginar que um determinado sistema em malha aberta com função de 
transferência C(s)G(s) seja estável. Aplicando o critério de Nyquist com o percurso 
fechado C que envolve todo semiplano direito complexo, concluímos imediatamente 
que Np = 0. Como N, = Nerit + Np, à estabilidade do sistema em malha fechada 
estará assegurada se o mapeamento de C através de C(s)G(s) não envolver o ponto 
crítico —1 + j0. No plano complexo, esse não envolvimento pode ser evidenciado 
através do cálculo de dois indicadores denominados margens de fase e de ganho 
“como mostra a Figura 4.3. Sendo o mapeamento C(jw)G(jw) para todo w 2 O 

mostrado em linha cheia, fazendo o seu conjugado notamos que o ponto crítico 
não é envolvido e, pelo critério de Nyquist, sabemos que o sistema é estável. À 
margem de ganho MG indica que o mapeamento de sC(jw)G(jw) com o ganho real 
k = MG € R passa exatamente pelo ponto crítico e que um ganho ligeiramente maior 
causa instabilidade. Por outro lado, a margem de fase M F indica que o mapeamento 
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de KC (jw)G(jw) com o ganho complexo x = eJMÊ €e ÇC passa exatamente pelo 
ponto crítico e que uma fase ligeiramente maior também causa instabilidade. Para 
assegurar a estabilidade do sistema em malha fechada, devemos ter simultaneamente 
MF >0e MG > 1. Geralmente a margem de fase é medida em graus e a margem 
de ganho em [dB] e, neste caso, é necessário impor que MG > 0. As definições 
formais dessas grandezas são dadas a seguir. 


Definição 4.1 (Margem de ganho) A margem de ganho expressa em [dB] é dada 
por MG = —|C(jwf)G Gws )laB onde wf E€ R é a frequência de cruzamento com a 
parte negativa do eixo real, ou seja ZLC(jw)G(jwp) = —180°. 


Definição 4.2 (Margem de fase) A margem de fase expressa em graus é dada 
4" — O A E Z A . 

por MF = 180 + LC (jwg)G (jwg) onde wg ER é a frequência de cruzamento com 

o círculo unitário, ou seja |C (jwg)G(jwg)lag = O dB. 


Com estas definições, não há dificuldades para que as margens de ganho e de 
fase sejam determinadas a partir dos diagramas de Bode da função de transferência 
C(s)G(s). E preciso ficar bastante claro que as margens de ganho e de fase são cal- 
culadas a partir da função de transferência em malha aberta C(s)G(s) mas indicam 
a estabilidade da função de transferência em malha fechada F(s). Essa importante 
propriedade decorre imediatamente do critério de Nyquist. 

Para fixar essas ideias, vamos considerar dois casos bastante simples. Para 
C(s)G(s) = g/s, com o > 0, a função de transferência em malha fechada é de 
primeira ordem, dada em (4.3). Imediatamente obtemos MG = +00 e MF = 90º. 


Definindo 
2 


C(s)G(s) = ———— 

(9G) = qi (4.10) 
obtemos a função de transferência de segunda ordem (4.4). A margem de ganho 
é MG = TOS pois o semieixo real negativo é atingido assintoticamente e o limite 
limu C(jw)G(jw) = O se verifica. O cálculo da margem de fase é um pouco mais 


complicado. Introduzindo a variável auxiliar VB = wg/wn a condição da Definição 
4.2 é colocada na forma 


| 1 
Clio) (ju) = = =1 4 
VE vB +] id 
ou seja, 82 + 4828 — 1 = 0, cuja única solução de interesse permite obter 
Wg = \/ —2E2 + V(26)2+1 wn (4.12) 
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bem como a margem de fase 
MF = 180º + ZC(jwg)G(juwg) 


= 180º — 90º — tg H/8/2€) 
180° — 90º — 90º + tg H(2€//8) 


di 2 (4.13) 


= t 
e Tra 28 


Felizmente, para todos os efeitos práticos, adota-se a aproximação linear M F = 1004 


raus. 
ndo a margem de fase for expressa em g | 
“um fato de grande importância em projetos de sistemas de controle resulta da 


comparação entre as equações (4.9) e (4.12), isto é 


Va -28)+ 0282 +1 sa 


W = Wg 
| /—282 + y (26°) +1 


usão de que a largura de faixa W e a frequência, que define a 
a da outra, mantendo-se constante 


permitindo a concl e À 

| ar um 
margem de fase wg, dependem de torma tme j x t 
O o de amortecimento. Ademais, fazendo o gráfico da relaçao W/wn em funçao 


de £, verifica-se que ela varia pouco em todo o intervalo £ € (0,1) e que 


W = (5) wWg (4.15) 


pode ser adotada com uma, boa precisão. Esta apro- 
ue. ao fixarmos uma determinada largura de faixa, es- 

3 l . 
ência que define a margem de fase e vice-versa, com 


é uma aproximação que 
ximação permite concluir q 
tamos também fixando a frequ 
consequências que serão colocadas e 
baseiam em cálculos realizados para fun 


estas funções como aproximações via polos dominantes. 


itéri ínio do tempo 
Até o momento discutimos diversos critérios de desempenho no domínio d p 
m outro critério que leva 


m regime permanente. 


e no domínio da frequência. Passamos, agora, à discutir u 
em conta a resposta temporal do sistema em malha fechada e 


m evidência mais adiante. Estas conclusoes se 
ções de transferência de primeira ou de se- 


+ 
gunda ordens. Elas permanecem válidas para F(s) de ordem qualquer que admita 
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O erro em regime permanente para um sistema em malha fechada estável, definido 
pela relação y(s) = F(s)r(s) é dado por 


eper = lim (r(t) — y(8)) (4.16) 
e, sem levar em conta nenhuma informação a priori sobre o sinal de referência r(t), 
adota-se os seguintes sinais padronizados 


l | 
P(s)=,h=1,2, ENO 


de tal forma que para k = 1 a entrada é um degrau unitário, para k = 2 uma rampa 
unitária, para k = 3 uma parábola unitária e assim sucessivamente. Note que para 
k = 0, a entrada se reduz a um impulso unitário e eper = O como consequência 
da estabilidade do sistema em consideração. A definição dada abaixo coloca em 
evidência uma propriedade estrutural de sistemas dinâmicos que é de singular im- 
portância para o projeto de sistemas de controle. 


Definição 4.3 (Tipo de sistema) Um sistema dinâmico a tempo contínuo cuja 
função de transferência tem k > O polos na origem (s = 0) é dito sistema do tipo k. 


De forma similar, uma função de transferência com k polos em s = 0 é dita ser do 
tipo k. | 


Alguns aspectos desta definição devem ser ressaltados. Em primeiro lugar, uma 
função de transferência assintoticamente estável é sempre do tipo zero e se um 
determinado sistema for do tipo k > 1 ele não pode ser assintoticamente estável 
pois terá k polos em s = 0. Em segundo lugar, a função de transferência C(s)G(s), 
do tipo k, que resulte em uma função de transferência em malha fechada 


C(s)C(S) 


F) = Tr c(c6) 


(4.18) 


assintoticamente estável, faz com que F(s) seja do tipo zero. De maneira algo 
surpreendente, o lema a seguir estabelece a relação entre tipo e erro em regime 
permanente para a estrutura de controle em malha fechada. 


Lema 4.1 Seja um sistema em malha fechada com realimentação unitária, assin- 
toticamente estável, com função de transferência F(s). O erro em regime perma- 
nente devido à entrada f(s) = 1/s*, k = 1,--- é nulo se e somente se a função de 
transferência C(s)G(s) for, no mínimo, do tipo k. 
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Prova : Assumimos inicialmente que a função de transferência C(s)G(s) seja do 
tipo £ > 0. Lembrando que, por hipótese, F(s) é assintoticamente estável, podemos 
calendar o erro em regime permanente com auxílio do teorema do valor final, ou seja 


Eper = lim s(1 — F(8))f(s) 


- ia (oea) (F) 


o rg ps (4.19) 
= Lim hE2 


onde as constantes acima indicadas, para k = 1,2,---, denominadas constantes de 


erro, são dadas por 
Ki = limstiC(s)G(s) 
s>0 


+oo, LES 
= valor finito, k=t+1 (4.20) 
0, k>t+2 


e verificamos que o erro de regime permanente Eper correspondente à entrada f(s) = 
1/s* é nulo se e somente se o tipo da função de transferência C(s)G(s) for tal que 


>k >| 1, fazendo com que o seu tipo l seja maior ou igual a k > 1, o que prova O 


O 
lema proposto. 


Esse resultado é simples e, em alguma medida, surpreendente. Ele implica que 
se desejarmos projetar um sistema de controle que siga com erro nulo, por exemplo 
uma rampa, basta impor que a função de transferência do controlador C(s) faça com 
que C(s)G(s) seja do tipo dois. Se G(s) for de tipo zero, isto é conseguido fazendo 
com que C(s) tenha dois polos na origem, o que naturalmente define a classe de 
controladores a ser considerada. Os cálculos realizados até agora permitem enfatizar 
alguns pontos que julgamos importantes. Se o tipo de C(s)G(s) for ad, então 
os erros em regime permanente para todas as entradas f(s) = 1/8º com I <k <€ 


o A p+-1 / e / = 
serão nulos. Além disso, para a entrada f(s) = 1/s +1 o erro será finito e poderá ser 


calculado a partir da constante 


K, = lim s“C(s)G(s) (4.21) 
s>0 


| : A Ee k ; 
que será não nula e finita. Entretanto, para entradas f(s) = 1/sº com k > (+2, O erro 
em regime permanente será ilimitado. Como são as mais usadas, as tres primeiras 
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plano s 


Figura 4.4: Lugar das raízes e resposta temporal 


constantes Ko, Kı e K2 recebem denominações especiais, Kp - constante de posição, 
K, - constante de velocidade e Ka - constante de aceleração, respectivamente. 


Exemplo 4.3 Para ilustrar os resultados apresentados, consideramos novamente o con- 
trole do motor de corrente contínua com função de transferência 


1 
1482 +15s+2 


Inicialmente consideramos um controlador proporcional com função de transferência C(s) = 
k, o qual mantém o sistema em malha fechada estável para todo «x > 0. Porém, o erro em 
regime permanente para a entrada f(s) = 50/s é dado por, 


Eper — 50/(1 T K/2) 


Aumentando « > 0, o erro em regime permanente diminui mas nunca se anula. Como se pode 
ver no lugar das raízes, ao tentar diminuir o erro, aumentando o ganho, a resposta se torna 
mais oscilatória e o fator de amortecimento diminui. Uma segunda possibilidade é considerar 
um controlador integral com função de transferência C(s) = k/s. Como C(s)G(s) é do tipo 
um, o erro para o degrau de velocidade dado anteriormente será nulo desde que o sistema 
em malha fechada seja estável. Com o estudo apresentado no Exemplo 3.11, aplicando o 
critério de Routh, a estabilidade é assegurada para todo «x tal que O < x < 2,1429. A Figura 
4.4 mostra o lugar das raízes de 1 + «G(s)/s = 0 paras > 0. O valor «s = 0,072 faz com que 
os dois polos dominantes sejam coincidentes em s = —0,0744 e essa situação corresponde ao 
menor tempo de estabilização e fator de amortecimento unitário. A mesma figura mostra 
as respostas do sistema em malha fechada para a entrada F(s) = 50/s em duas situações 
distintas. A curva contínua corresponde ao controlador C(s) = 0,25/s tratado nos exemplos 
anteriores, enquanto que a curva tracejada corresponde ao controlador C(s) = 0,072/s. 
Como esperado, o segundo controlador faz com que o sistema em malha fechada deixe de 
oscilar e tenha um tempo de estabilização ligeiramente menor que o do primeiro. E 


G(s) 
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4.3 Alocação de Polos 


Até o presente estabelecemos critérios para que um determinado sistema de con- 
trole tenha um comportamento adequado. Os chamados critérios de desempenho 
permitem determinar um conjunto 92 C C de tal forma que o projeto de contro- 
le resume-se na determinação de um controlador C(s) de tal forma que todos os 
polos da função de transferência em malha fechada F(s) se situem no interior de 
Q. Ou seja, C(s) deve ser determinada impondo-se que todo s E€ C que satisfaz 
1 + C(s)G(s) = 0 pertença a Q. Essa operação é denominada alocação de polos. 
Para facilitar o desenvolvimento, introduzimos a seguinte notação 


o Ne(s) C(s) e Nc(s) (4.22) 


Dals) ` = Dels) 


onde os respectivos polinômios são definidos na forma 


G(s) 


MG nG 
No(s) = 5 bis’ , Dals) =X ais (4.23) 
i=0 1=0 


com nG 2 mg e 
me no 
Nols) = ` Bs De(s) = o Qis“ (4.24) 
i=0 i=0 


com no > mc. Note que todos os coeficientes dos polinômios Na(s) e Dals) 
são conhecidos enquanto que os coeficientes dos polinômios No(s) e Dc(s) são as 
incógnitas a serem calculadas para que os polos de 


N Ne(s)Ne(s) 
8) o De(s)De(s) HF No(s)Ne(s) (62) 


estejam localizados no interior de Q. Uma maneira simples de impor esta condição 


F( 


é escolher nc + ng pontos 81,::* , Snc+ng do interior de 2 e determinar o polinômio 
nc+tng notna 
P(s)= || (s—si;)= X pis’ (4.26) 
i=1 i=0 
sendo que os seus coeficientes p; para todo i = 0,---,nc + ng são reais desde que 


os pontos escolhidos em Q mantenham a relação de complexos conjugados. Como 
por construção, as raízes de P(s) = 0 estão no interior de Q, a solução da equação 


De(s)De(s) + Ne(s)Ne(s) = P(8) (4.27) 
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conhecida como equação Diofantina, em relação aos coeficientes dos polinômios 
Nc(s) e Do(s), suas incógnitas, determina estes polinômios e consequentemente 
o controlador C(s). Observe que ao realizarmos os dois produtos de polinômios 
obtemos, no lado esquerdo, um polinômio de grau nc + ng que deve ser igualado a 
P(s). Isto é feito igualando-se todos os coeficientes dos termos de mesmo grau. 

Como apenas um dos polinômios de cada produto que aparece no lado es- 
querdo da equação Diofantina é desconhecido, os coeficientes do polinômio resul- 
tante dependem linearmente dos coeficientes dos polinômios incógnitas. De fato, 
coletando nos vetores a = [ag > an] E RPCTI B = [Bo -> Bmo] E RM 
e p = [po Prcinç) E RPctre+l os coeficientes de Do(s), No(s) e P(s) res- 
pectivamente, definindo as matrizes de Silvester associadas aos polinômios Da(s) e 
Ne(s) ou seja 


ao O O 
Sp= | 4 do 0 = R(rcine+D)x(no+1) (4.28) 
a 
bo O 0 
Sn = bi bo > 0 c Rotna +1)x(mo+1) (4.29) 
o bo 


a equação (4.27) se converte em um sistema de equações lineares 


S | 3 | =p (4.30) 


onde S = [Sp Sy] € Rirotne+l)x(nctmc+2) | No caso em que S é uma matriz 
quadrada e não singular, o sistema (4.30) admite uma única solução que determina 
os coeficientes dos polinômios Dc(s), No(s) e, por consequência, a função de trans- 
ferência do controlador C(s). Por construção, os polos de F(s) são raízes da equação 
P(s) = 0, situando-se todos no interior de Q. A condição para que esta propriedade 
seja assegurada é que nc + ng + 1 = nc + mc +2 ou ainda nc > mc = ng- 1, 
pois, além de resolver a equação Diofantina, é preciso impor que C(s) tenha um 
denominador com ordem maior ou igual a do numerador. Neste caso, obtemos 


| 3 | =8"p (4.31) 


e construímos imediatamente a função de transferência C(s). 


| 
| 
| 
| 
| 
| 
| 


| 
| 
| 
É 


j 
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Não há nenhum interesse em fixar nc > mc > ng — 1 caso em que o número de 
equações em (4.30) é estritamente inferior ao número de variáveis. O sistema (4.30) 
admite infinitas soluções pois a ordem do controlador é maior que a necessária ou, 
dito de outra maneira, procura-se um controlador com complexidade excessiva. 

No outro extremo, há muito interesse em se fixar nc > mc mas com mç < 
ng — 1 com o intuito de determinar um controlador de ordem reduzida. Neste caso, 
infelizmente, o número de equações em (4.30) torna-se estritamente maior que o 
número de variáveis fazendo com que elas geralmente não admitam nenhuma solução. 
O problema de alocação de polos via controladores de ordem reduzida ainda não foi 
completamente resolvido, entretanto, propomos um enfoque que em muitos casos, 
mas não em todos, fornece soluções razoáveis e adequadas. 

Dois polinômios de mesma ordem P(s) e P(s) são iguais se e somente se todos 
os seus coeficientes forem iguais. Portanto, podemos dizer que a “distância” entre 
dois polinômios é dada pela distância entre os vetores p e p que contém os seus coefi- 
cientes. Mantém-se verdadeiro o fato de que p = p implica que ambos os polinômios 
são iguais. Propomos então substituir a equação linear (4.30) pelo problema de 
distância mínima Euclidiana 


2 
a 
E S | 6 | — p (4.32) 
onde a norma ||x||2 = x'x é igual ao quadrado distância entre x e a origem. Trata-se 
de um problema de mínimo quadrado cuja solução é bem conhecida e se escreve na 
forma 

| E | = (S'S) *S'p (4.33) 

p 

sendo a matriz S'S quadrada e inversível, na verdade, simétrica e definida positiva. A 
solução dada em (4.33) produz um controlador tal que De(s)Da(s)+Nc(s)Na(s) = 
P(s)  P(s) sendo que P(s), no presente contexto, é o polinômio o mais próximo 
possível de P(s). Infelizmente, nada é possível dizer a respeito das raízes de P(s) = 0, 
em particular, se estão no interior de Q. Esse fato deve ser testado a posteriori. É 
claro que se S for quadrada e inversível, a solução (4.33) reduz-se àquela anterior- 
mente obtida (4.31), que fornece a solução única da equação Diofantina, caracteri- 
zada por P(s) = P(s). 

Uma questão relevante que ocorre neste ponto é como projetar um controlador 
que, além de posicionar os polos de F(s) em Q, ainda faça com que C(s)G(s) seja 
de um determinado tipo k > 1. Vamos considerar o caso mais simples em que G(s) 
seja do tipo zero e desejamos fazer com que C(s)G(s) seja do tipo um. Isto requer 
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Figura 4.5: Desempenho de diversos controladores 


que C(s) tenha um polo na origem ou seja D.(0) = 0 o que implica em og = 0. 
Construindo (4.30) com nc = mc = ng, o número de variáveis supera por um 
o número de restrições, o que permite incluir a restrição adicional ao = 0. Para 
obter as demais, basta retirar do vetor a o seu primeiro elemento, retirar de S a sua 
primeira coluna e resolver o sistema resultante. Note que, como resultado desta ma- 
nipulação, obtemos novamente um sistema linear com um número de restrições igual 
ao número de incógnitas cuja solução é indicada em (4.31). Uma segunda possibili- 
dade, normalmente mais simples, consiste em resolver o problema de alocação de po- 
los considerando a função de transferência auxiliar Go(s) = G(s)/s no lugar de G(s) 
e determinar o controlador Co(s). O controlador procurado tem função de trans- 
ferência C(s) = Co(s)/s pois, assim procedendo, temos Co(s)Go(s) = C(s)G(s). 


Exemplo 4.4 Novamente o objetivo é controlar a velocidade angular do motor de corrente 
contínua com função de transferência 


1 


E EERE AER 
CEET 


para que o erro em regime permanente ao degrau ?(s) = 50/s seja nulo. Para isto, devemos 
projetar um controlador de tal forma que C(s)G(s) seja do tipo 1, isto é, C(s) deve ter pelo 
menos um polo na origem. Neste caso, devemos resolver a equação Diofantina para a função 


de transferência auxiliar À 


= 1483 +1582 + 2s 
para a qual mg = 0 e ng = 3. Como ilustração, três casos foram considerados, cada qual 
com controladores com um polo na origem mas de ordens diferentes. 

No primeiro caso, consideramos um controlador com dois polos e dois zeros nc = mc = 
2 = ng—1 o que assegura que a equação Diofantina tenha uma única solução. Como a função 


Go(s) 
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de transferência em malha fechada tem ordem cinco, levando em conta as características em 
malha aberta, escolhemos P(s) = (s + 1)2(s +0,25)? para impedir que oscilações ocorram e 
que o tempo de estabilização seja adequado, aliás, bem menor que aquele obtido no Exemplo 
4.3 com um controlador integral. A equação (4.30) se escreve na forma 


o 0 0|1 00 ao 0,0156 
e 0 O. 1 0 a 0,2188 
15 2 0/0 0 1 œs | | 1,1406 
m do 20 0.0 Bo | | 2,6875 
0 14 AO 0 0 Bı 2.7500 
O 0 140 0 0 Bo 1 


cuja solução fornece o controlador Co(s), bem como o controlador C (s) = Co(s)/s com um 


igem 
PoR 1,419(s + 0,9431) (s + 0,1635) 


N E S N A E 
C(s) = a e + 0,7462) 
sendo que, como se pode verificar, Os polos de F (s) coincidem com as raízes de P(s) = 0. 


No segundo caso, procuramos um controlador com um polo e um zero, de tal forma que 
re emo silsna- 1 = 92. Com as mesmas considerações anteriores escolhemos P(s) = 


(s + 1)(s + 0.25)3. A equação (4.30) fica na forma 


0 0ļl1 O a 0,0156 
2 0l0O 1 0,2031 
Be i O = | 0,9375 
14 1510 0 Do 1,7500 
0 14/0 0 Br 1 


que, infelizmente, não admite solução. Porém, resolvendo o problema (4.32), cuja solução é 
dada em (4.33), determinamos O controlador 
1,4253(s + 0,1569) 
s) = a(s + 0,7405) 
Como era esperado, os polos de F(s) dados por —1,1393, —0,2570 + 90,1494 e —(,1586 não 
mais coincidem com as raízes de P(s) = 0. No último caso, procuramos um controlador 
proporcional, isto é, caracterizado por nc = mc = 0 < ng — 1 = 2 e escolhemos P(s) = 
(s +0.25). A equação (4.30) fica na forma 


0/1 0,0156 
210 oo | _ | 0,1875 
1510 | = 0,7500 
1410 1 


a qual, novamente, nao admite nenhuma solução. A de distância mínima dada em (4.33) 
permite determinar o controlador integral 
0,2591 

Oae m= 


5 
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e verifica-se que os polos do sistema em malha fechada são —0,0655 + 70,1241, —0,9405 e 
também não coincidem com as raízes de P(s) = 0. Nos últimos dois casos, os polos de 
F(s) não coincidem com as raízes de P(s) = O mas os controladores obtidos estabilizam o 
sistema em malha fechada. Nos casos em que a equação Diofantina não pode ser resolvida, 
por se procurar controladores de ordem reduzida, uma verificação a posteriori a respeito da 
localização dos seus polos se faz necessária. 


A Figura 4.5 mostra a resposta do sistema em malha fechada para a entrada ?(s) = 50/s 
com os três controladores que acabamos de calcular. Nota-se claramente que as respostas, 
em linhas contínuas, dos dois primeiros, embora sejam de ordens distintas, se comportam 
de maneira bastante semelhantes enquanto que o terceiro, em linha tracejada, apresenta um 
desempenho mais modesto. Em todos os casos, o erro em regime permanente é nulo. [3 


A alocação de polos através da solução da equação Diofantina é uma ferramenta 
poderosa de síntese de controladores para sistemas de controle. No caso em que 
a ordem do controlador é suficientemente elevada, para que uma solução exista, O 
cálculo do controlador depende apenas da determinação da solução de um sistema 
de equações lineares o que pode ser feito numericamente, sem grandes dificuldades, 
mesmo que as dimensões envolvidas sejam grandes. No caso em que se procura 
controladores de ordem reduzida, a solução não é exata e, portanto, deve ser obriga- 
toriamente validada a posteriori, tendo em vista que nada se pode garantir a respeito 
da localização final dos polos do sistema em malha fechada em relação à localização 
inicialmente estipulada. 


4.4 Controladores Clássicos 


Como já foi discutido no Capítulo 2, existem três classes de controladores com 
largo uso em aplicações práticas. Duas delas, que passamos a discutir em seguida, 
foram bastante utilizadas desde a segunda metade do século passado até os dias 
atuais, sobretudo devido à baixa complexidade de sua implementação. Entretanto, 
elas tendem a dar lugar aos controladores de uma terceira classe, com elementos de 
maior complexidade, na medida que aumenta a utilização de controladores digitais 
que são implementados numericamente através de microcomputadores cada vez mais 
rápidos e possantes, eliminando quase que totalmente a necessidade de trabalhar com 
controladores mais simples. Como veremos, certas aproximações permitem concluir 
que os controladores da primeira classe “Atraso e Avanço” podem ser vistos como 
casos particulares daqueles da segunda classe “PID”. 


E RR RR nana pan EEE 
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4.4.1 Atraso e Avanço 


São controladores de primeira ordem com função de transferência 


Gens (4.34) 
S+PD 


comk>0,2>0ep>0.5Sep<z,a fase de C(jw) é sempre negativa e o contro- 
lador é do tipo Atraso. Ao contrário, se p > 7, à fase de C(jw) é sempre positiva e o 
controlador é do tipo Avanço. Portanto, essas denominações estão associadas à pos- 
sibilidade do controlador adicionar fase positiva ou negativa ao produto C(s)G(s). 
Observe que, em ambos os casos, à fase total não ultrapassará +90º. 

Para fins de projeto, os controladores Atraso e Avanço devem ser vistos como 
aproximações dos controladores PI e PD, respectivamente. De fato, a igualdade 


k; s+z 
À >k (4.35 
WE s+ p ) 


é verdadeira para todo s € C, desde que k = kp, Z = ki/kp > p = 0. Da mesma 


forma a aproximação 


SSRA ; 
kp + kas $ ho (4.36) 


é válida em toda faixa de frequência w Jp & 1, desde que k = kap, z = kp/ka < 
p. Para o controlador PD, cuja função de transferência não é realizável, pois o 
número de zeros ultrapassa o número de polos, a aproximação obtida através de 
um controlador Avanço com p suficientemente grande permite sua implementação 
prática através de dispositivos elementares. Assim sendo, resta discutirmos as regras 
básicas para o projeto de controladores do tipo PID que são os mais gerais possiveis 


dentro das classes em estudo. 


4.4.2 PID 


A classe de controladores PID tem elementos mais simples que são os contro- 
ladores P, PI e PD obtidos a partir da imposição que determinados ganhos sejam 
nulos. As características básicas do controlador PI (Atraso) mais relevantes para O 
projeto são as seguintes: 

e Transitório - Conforme z > p > 0 aumenta, no lugar das raízes o coeficiente 

linear das assíntotas aumenta e, portanto, os polos tendem para a direita. O 
tempo de estabilização tende a aumentar. 
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e Regime permanente - Como C(0) = kz/p — oo, então as constantes de 
erro tendem a aumentar. Como consequência, os erros de regime permanente 
tendem a diminuir. 


Da mesma forma, as características básicas mais relevantes do controlador PD 
(Avanço) são as seguintes: 


e Transitório - Conforme z < p diminui, no lugar das raízes o coeficiente linear 
das assíntotas diminui e, portanto, os polos tendem para a esquerda. O tempo 
de estabilização tende a diminuir. 


e Regime permanente - Como C(0) = kz/p — 0, então as constantes de 
erro tendem a diminuir. Como consequência, os erros de regime permanente 
tendem a aumentar. 


Nota-se que, de certa forma, os dois tipos de controladores se complementam. O 
importante é projetá-los de modo a reforçar os seus aspectos positivos e atenuar os 
seus aspectos negativos. Isto nos leva à seguinte regra de projeto : O controlador PI 
é projetado para melhorar o desempenho em regime permanente enquanto que o con- 
trolador PD é projetado para melhorar o desempenho durante o transitório. Assim 
sendo, o projeto de um controlador PID pode ser feito em três etapas sucessivas: 


1. Projetar um PI e obter o tempo integral T; = kp/ki. 
2. Projetar um PD e obter o tempo derivativo tg = ka/ kp- 


3. Projetar o controlador PID com função de transferência escrita na forma 


i 
C(s) =% Pae (4.37) 


onde o ganho « > 0 é determinado com o lugar das raízes. 


Dois aspectos devem ficar bastante claros quanto ao procedimento que acabamos 
de propor para projeto de um controlador PID. Os dois passos iniciais permitem 
determinar duas constantes T; e Ty com as quais o PID se escreve na forma C(s) = 
KCr(s), sendo que Cr(s) é uma função de transferência conhecida. Portanto, nao 
há dificuldade em se determinar k > 0, a partir do lugar das raízes da equação 
característica em malha fechada 1 + sCr(s)G(s) = 0. Após ter sido calculado o 
ganho « > 0, resta implementar o controlador C(s) que não é realizável. Para isto, 
é necessário adotar a aproximação 


1 S 
C; = 1+ — + Ta 4, 
m T E Ts + PE (4.38) 
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Tols 0 


Tabela 4.1: Regra de Ziegler-Nichols 


que é válida para toda frequência tal que rw < 1. A determinação dessa cons- 
tante de tempo, suficientemente pequena, é feita com a preocupação de manter 
aproximadamente inalterada a largura de faixa do sistema em malha fechada. 


4.4.3 Regra de Ziegler-Nichols 


Esta regra é importante pois tem sido usada com sucesso em diversas situaçoes 
práticas onde G(s) representa um sistema dinâmico estável. O objetivo é determinar 
os parâmetros de controladores da classe PID, ou dito de outra forma, o objetivo é 
sintonizar os parâmetros do controlador. Com a equação característica 1 + G(s) = 
0, determina-se o valor do ganho «K = Kose > 0 de tal forma que o sistema passe 
a oscilar e determina-se o período de oscilação Tose. Os coeficientes de cada tipo 
de controlador são dados na Tabela 4.1. Note que os parâmetros necessários para 
projetar um controlador pela regra de Ziegler-Nichols (kosc, Tose = 27/ Wosc) podem 
ser determinados experimentalmente ou pela aplicação do critério de Routh ou de 
Nyquist. No lugar das raízes de 1 + «G(s) = 0, o ganho Kosec > 0 corresponde ao 
valor de «x > 0 para o qual ocorre cruzamento de ramos com o eixo imaginário em 
s = +jwose. Adotando o critério de Nyquist, para este valor de ganho, a curva 
G(jw) passa pelo ponto crítico —1/s + 90. Alternativamente, com o critério de 
Routh-Hurwitz, se apenas dois polos cruzarem o eixo imaginário, a linha st da 
tabela de Routh se anula. 

Em conclusão, é preciso enfatizar que os projetos dos controladores clássicos 
são baseados em algumas características gerais que não são exatas. Assim sendo, 
devemos estar atentos para: 


e Fazer diversas tentativas e comparar os respectivos desempenhos para a escolha 
do melhor controlador. 


e Validar, através de simulações, o controlador escolhido. 
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Além disso, um bom projeto começa pela definição correta e precisa de critérios de 
desempenho aceitáveis. Na prática, os seguintes valores são considerados adequados 
se forem simultaneamente atendidos: 


e Hator de amortecimento mínimo £ > 0,3. 


Valor de pico máximo no tempo w) < 0,3. 


Valor de pico máximo em frequência & < 1,6. 


Margem de fase mínima MF > 30º. 


Todos estes critérios estabelecem restrições sobre o fator de amortecimento. Se 
o fator de amortecimento dos polos dominantes for € > 0,35 todos eles serão si- 
multaneamente atendidos. O motivo de adotarmos cada um deles separadamente é 
que, em geral, não trabalhamos com sistemas de segunda ordem e nem mesmo com 
sistemas que apresentem polos dominantes bastantes separados dos demais. Em sis- 
temas reais, atender cada um destes critérios separadamente indica que foi possível 
projetar um sistema de controle de boa qualidade. A seguir, dois projetos serão 
apresentados em detalhes para ilustrar os aspectos teóricos até aqui abordados. 


4.5 Projeto via Lugar das Raízes 


Vamos ilustrar os procedimentos estudados anteriormente para projetar um con- 
trolador para a malha “Potência Ativa - Frequência” em um sistema de geração de 
energia elétrica, denominado simplesmente de controle PF. Para maiores detalhes, 
ver a discussão a respeito deste tema nas notas bibliográficas incluídas no final deste 
capítulo. 

Em operação normal, a demanda P} é suprida pela geração F; e O sistema opera 
em uma frequência nominal fo. A Figura 4.6 fornece a estrutura do modelo apro- 
ximado (linear) em malha aberta, válido para pequenos desvios em relação a este 


ponto de operação. Todos os valores numéricos são normalizados e expressos em 
unidades coerentes. 


A função de transferência 
1 
Hr(s) = 


a (4.39 
(0,35 + 1)(0,08s + 1) o 


cuja saída é a potência gerada ôP}, representa a turbina e o dispositivo de controle 
do fluxo de água (ou de vapor) que são acionados por um sinal de controle ôP.. 
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ôP 


ôP, a | = 
—( —| Hr(s) Ur 
+ + 


Figura 4.6: Controle PF 


Ela tem dois polos, um com constante de tempo pequena devido aos dispositivos 
eletrônicos de acionamento e outro, com constante de tempo maior, que representa 
o efeito mecânico do movimento das pás da turbina. A função de transferência 


120 


(20s + 1) (AN 


Hr(s) = 
tem como entrada a diferença entre a geração e a demanda. Essa diferença produz 
uma variação na frequência de geração ò f , cuja dinâmica depende da inércia do 
gerador que é descrita por um único polo com constante de tempo muito maior que 
aquelas de Hr(s). A Figura 4.6 mostra também que o sinal de controle ôP, é decre- 
mentado por uma quantidade que depende linearmente da variação de frequência 
Ô f , com ganho R = 2,4 em unidades coerentes. 

Deseja-se projetar um controlador com funçao de transferência C(s) de tal forma 
que o sistema em malha fechada com a lei de controle 


SÊ. = —C(s)ôf (4.41) 


apresente as seguintes características básicas que devem expressar um desempenho 
adequado do sistema de controle a ser projetado: 


e Erro de regime permanente nulo para variação da demanda na forma de um 
degrau 


Ê; = —— (4.42) 
S 


que corresponde a uma variação de 1% na demanda nominal. Observe que 
o controle deve alterar a geração para suprir a demanda e fazer com que a 
frequência retorne ao seu valor nominal fo. 


e Margem de fase, tempo de estabilização e valor de pico (no tempo) em níveis 
aceitáveis. 
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O primeiro passo é converter o diagrama de blocos da Figura 4.6 com a malha 
de realimentação definida pela lei de controle (4.41) na estrutura básica de controle 
até aqui estudada, tendo como entrada a variação da demanda P} e como saída a 
variação na frequência de geração ôf. Neste sentido, aplicando a transformada de 
Laplace no diagrama de blocos da Figura 4.6, obtemos - 


A — Hp A HH , 
of = — Hr spy — HrHr 
f GAUR "n Tan 
= Wo6B,+G6B. (4.43) 


com W (s) e G(s) calculadas a partir das funções de transferências dadas anterior- 
mente, ou seja 


mej- 8966-250 
53 + 15,8852 + 42,465 + 106,2 A 
250 
ee (4.45) 


s3 + 15,8852 + 42,465 + 106,2 


sendo que ambas têm os mesmos polos —13,2902 e —1,2966 + 52,5127 com os dois 
mais próximos do eixo real claramente dominantes. Finalmente, com a lei de controle 


Ê., = —C(s)óf e a relação (4.43), podemos calcular a função de transferência em 
malha fechada 


x W A 
df = ——— ôP 

Largo An 
E interessante notar que essa função de transferência depende de C(s) de uma forma 
diversa daquela já estudada pois o seu numerador não depende de C(s). Entretanto, 
sua equação característica 


1+C(s)G(s) = 0 (4.47) 
é idêntica à equação característica de um sistema com realimentação unitária. Ade- 
mais, como W(0) = —G(0) Æ 0 o valor de óf(t) será nulo em regime permanente 


desde que C(s) tenha pelo menos um polo na origem. Assim sendo, os conceitos e 
técnicas apresentados anteriormente se aplicam. | 

Com o intuito de aplicar a regra de Ziegler-Nichols, construímos a tabela de 
Routh para a equação característica 1 + sG(s) = 0, que corresponde a introduzir no 
sistema um controlador proporcional. 


sº 1 42,46 

52 15.88 106,2 + 250% 

s! | 568,06 — 250% (4.48) 
sº | 106,2 + 250% 
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Para O < k < 2,2723, a primeira coluna tem todos os elementos positivos. Para 
k > 2,2723, ocorrem duas trocas de sinal, indicando que Kose = 2,2723. Como este 
valor anula a linha st, o polinômio auxiliar gerado pela linha s? permite determinar a 
frequência de oscilação wose = 6,5162 [rad/s] e consequentemente Tose = 0,9642 [s]. 
Como para atender a especificação de regime permanente o controlador deve ter 
um polo na origem, determinamos os seguintes controladores a partir da regra de 
Ziegler-Nichols: 


e Controlador PI : A Tabela 4.1 fornece os parâmetros deste controlador 
como sendo kp = 1,01 e T; = 0,81 [s] que permitem determinar 


s + 1,236 
C(s) x ——— (4.49) 
S 
Verifica-se que os polos dominantes do sistema em malha fechada têm um fator 
de amortecimento £ = 0,04 e margem de fase MF ~ 7º. Esses valores, muito 
baixos, tornam esta solução inaceitável. 


e Controlador PID : Novamente, com a Tabela 4.1 determinamos kp = 1,34, 
T; = 0,49 [s], Ta ~ 0,12 [s] e o controlador 


s + 4,762) (s + 3,571) 


C(s) = 0,161 (4.50) 


S 

A verificação dos mesmos índices de desempenho para o sistema em malha 
fechada revelam que o fator de amortecimento dos polos dominantes subiu 
para € = 0,21 e que a margem de fase atingiu MF ~ 27º, tornando a solução 
bem próxima de ser aceitável. 


O lugar das raízes é uma ferramenta bastante adequada para se tentar refinar o 
projeto do controlador PID e melhorar o seu desempenho. A ideia, similar àquela 
apresentada anteriormente, baseia-se em escrever o controlador PID na forma C(s) = 


nCr(s), onde 
1 


é uma função de transferência conhecida, tendo em vista que as constantes T; e Ty 
foram determinadas pela regra de Ziegler-Nichols e determinar k > 0 com o lugar 
das raízes de 1 + KCr(s)G(s) = 0. 

A Figura 4.7 mostra este lugar das raízes. Para x = 0,26 os dois polos complexos 
têm fator de amortecimento € = 0,30 e a mesma parte real do polo que pertence 
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- malha aberta 


RA DO ao ma A ow ww O w A A A A E O A MA 


Figura 4.8: Simulação no tempo dos controladores projetados 


ao ramo que sai da origem. Ademais, para este valor de ganho a margem de fase 
atinge o valor expressivo de MF = 86º. Com este refinamento, apenas ajustando 
o ganho de forma adequada, foi possível encontrar uma solução aceitável para o 
projeto proposto. 

Resta validar os controladores resultantes. Isso é feito mediante a simulação 
temporal do sistema em malha fechada obtido com os respectivos controladores e 
submetidos à entrada degrau dada em (4.42). A Figura 4.8 mostra as simulações 
realizadas. Nela, nota-se a resposta do sistema em malha aberta, isto é, operando 
sem nenhum controle. Como resposta a um aumento da demanda, o sistema passou 
a operar com um desvio permanente de frequência o que obviamente é inaceitável. 
O mesmo pode ser dito do controlador PI pois, embora em regime permanente, o 
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Figura 4.9: Amplificador operacional em configuração não inversora 


desvio de frequência se anule, o tempo de estabilização é muito grande e a resposta 
é muito oscilatória, confirmando as análises já feitas a seu respeito. As outras duas 
curvas em linhas contínuas representam as respostas com os controladores PID, um 
deles sintonizado com a regra de Ziegler-Nichols e, o outro, com o refinamento do 
ajuste do ganho pelo lugar da raízes. O tempo de estabilização, em cada caso, é 
aproximadamente o mesmo, mas o pico máximo do desvio de frequência é menor 
para o primeiro controlador. Em contra-partida o segundo tem uma margem de fase 
muito maior, indicando ser menos sensível a perturbações não modeladas presentes 
na prática. Esse tipo de compromisso entre soluções viáveis sempre estará presente 
nos projetos de controle, cabendo ao projetista a decisão final. Esse projeto também 
serve para, uma vez mais, colocar em evidência a regra de Ziegler-Nichols como sendo 
adequada, em geral, para sintonizar controladores do tipo PID. 


4.6 Projeto via Resposta em Frequência 


Vamos agora aplicar os resultados anteriores em um projeto envolvendo um am- 
plificador operacional realimentado. Inicialmente, considere o circuito mostrado na 
Figura 4.9 onde o amplificador operacional é modelado não apenas como um disposi- 
tivo de alto ganho mas com uma frequência de corte finita, ou seja, às = A(s)(de— da) 
com 
Ao 


A — 
(s) 1 + Tos 


(4.52) 


onde tipicamente Ao € (104, 105) é o ganho DC e 79 ! € (10,100) [Hz] é a frequência 
de corte. A impedância de entrada do amplificador operacional é infinita, de tal 
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Figura 4.10: Diagrama de blocos do amplificador 


forma que os resistores Rj e Ro formam um divisor de tensão que permite determinar 


z Ls Ri+R 
ba (z) ita p= IT a (4.53) 
2 


Com essas equações, podemos construir o diagrama de blocos correspondente ao 
circuito da Figura 4.9 que é mostrado na Figura 4.10, onde C (s) = 1/k. Trata-se 
de um diagrama de blocos idêntico àquele da estrutura básica de controle. A única 
diferença, para todos os fins irrelevante, é o bloco de saída com o ganho k. A função 
de transferência em malha fechada daquele circuito, entre a tensão de entrada Üe € 
a tensão de saída ds 


A(s)/h 

Es) = CR STE: (4.54) 
coloca em evidência que o inverso do ganho k > 1 faz o papel da função de trans- 
ferência de um controlador proporcional. Aplicando o critério de Nyquist na equação 
característica 1+k71 A(s) = 0, o fato de A(s) ser estável e de primeira ordem, implica 
que o sistema em malha fechada permanece assintoticamente estável para qualquer 

valor do ganho k. 
Para um amplificador com ganho k € (1,100) é válida a relação Ao/k > 1, que 
permite uma aproximação bastante precisa para a função de transferência em malha 


fechada 
k 


De (kro/Ao)s +1 


Imediatamente, identificamos F(s) como sendo a função de transferência de um 
filtro passa-baixas com ganho k e largura de faixa W = Ao/kro. Recuperamos 
uma propriedade muito conhecida, a saber, o produto Wk = Ao/To é constante 
para qualquer ganho k pois depende exclusivamente dos parâmetros internos do 
amplificador operacional. Para efeito de cálculo, adotando os valores típicos Ag = 
10º e 79! = 10 [Hz] temos uma largura de faixa de W = 1 [MHz] para k = 1. 


(4.55) 
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Figura 4.11: Amplificador modificado 


Enquanto apenas um amplificador de ganho k > 1 seja uma estrutura bastante 
estável e robusta, a conexão de mais de dois deles em série pode tornar-se uma 
estrutura instável, a depender dos ganhos envolvidos. De fato, como cada um deles 
tem impedância de entrada infinita, a função de transferência do conjunto é igual ao 
produto das funções de transferência de cada um, com três ou mais polos estAveIS: 
Neste caso, o mapeamento da resposta em frequência do conjunto cruzaráã O eixo 
real e a estabilidade dependerá do seu ganho. Uma situação semelhante ocorre 
quando consideramos a possibilidade de que os polos adicionais, que aparecem nas 
altas frequências de A(s), não terem sido devida e corretamente compensados. Para 
estudar esse aspecto, vamos supor que dispomos de um amplificador operacional, não 
com função de transferência A(s) mas sim com a seguinte função de transferência 


Ao 


a Me oo (4.56) 
(1+ rs)(1+as)(1 + Bs) 


Asem(8) = 


com nenhum zero e com três polos. Deseja-se projetar um amplificador que opere 
com uma margem de fase da ordem de 45º para todo ganho k € (1,100). Os seguintes 
valores numéricos 17! = 1 [kHz], o”! = 50 [kHz] e 87! = 1 [MHz] são adotados. 

É importante salientar que, se simplesmente utilizarmos a estrutura anterior com 
Asem(s) no lugar de A(s), a equação característica do sistema em malha fechada da 
Figura 4.10 torna-se 1+ k~! Asem(s) = 0. Como Asem(jw) cruza o eixo real negativo 
no ponto = — 10º e como, neste caso, o lugar crítico do critério de Nyquist é —k + JQ, 
verificamos que o circuito torna-se instável para todo k € (1,10). Assim sendo, 
aquela estrutura deve ser modificada para garantir a estabilidade e a margem de fase 
pré-fixada. A Figura 4.11 mostra a nova estrutura proposta, onde o amplificador 
operacional em configuração não inversora é modelado pela função de transferência 
Asem(s) e a impedância Z constitui o elemento a ser projetado. 

O primeiro passo é calcular a função de transferência em malha fechada. A partir 
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do circuito da Figura 4.11, temos 


Ue — Ua Us — Ua Va 


z 4. 
= R id 


cuja transformada de Laplace permite obter a relação ĉa = Hee + H,ôd,, onde 


H = (4 R Ze! (4.58) 
Hs = (ZI +kR YR! (4.59) 


sendo que estas duas funções de transferência não são independentes pois satisfazem 
a relação linear He + kH, = 1. Por outro lado, levando em conta a relação entre a 
entrada e a saída do amplificador operacional em configuração não inversora, dada 
na forma îs = Asem(de — ĉa). A função de transferência em malha fechada, entre a 
tensão de entrada ve e a tensão de saída ds pode ser escrita como 


Bal E C(s) Asem(s) 


SENSO a 


onde C(s) = Hs(s). Observe que ela tem a mesma estrutura que a anteriormente 
estudada e apresentada na Figura 4.10, porém com A(s) substituída por Asem(s). 
O efeito da impedância Z aparece em C(s) e pode ser interpretada como a função 
de transferência de um controlador a ser projetado que depende, portanto, de cada 
escolha particular de Z. Assim sendo, propomos fixar Z(s) bastante simples, como 
sendo um capacitor em série com um resistor, de tal forma que 


1 
sCr 


Z(s) = Rs + (4.61) 


depende dos valores da resistência Ry e da capacitância Cy a serem determinados. 
Substituindo (4.61) em (4.59), após algumas manipulações algébricas, obtemos 


C Rys +1 
Cij=h ec 4.62 
BE = (4.62) 
onde A 
T a A 4.63 
Popo Ri + Ro E 


Nesse ponto, as seguintes observações são pertinentes: Em primeiro lugar, como os 
resistores satisfazem a relação Ry > Ry, o controlador a ser projetado é do tipo 
atraso. Por outro lado, com os resistores Rj e Rə devidamente fixados para definir 
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um determinado ganho k > 1, o valor de R = RiRo/(Ry + Ro) é dado. Se as 
constantes de tempo Tyr € Ty com Ty > Ty de C (s) forem conhecidas, então 


Cy = 4 e a (464) 


definem Z(s). Se formos capazes de projetar um controlador do tipo atraso de tal 
forma que as especificações do projeto sejam atendidas, as suas duas constantes de 
tempo determinam unicamente a impedância procurada. 

De maneira mais específica, o projeto requer a determinação de um controlador 
C(s) do tipo atraso tal que o amplificador em malha fechada, para todo ganho 
k € (1,100), atenda as seguintes especificações: 


e Seja assintoticamente estável e tenha margem de fase MF > 45º. 


e Tenha uma largura de faixa Wsem aproximadamente igual à largura de faixa 


W de F(s). 


Com o objetivo de atender estas especificações, vamos inicialmente considerar 
k = 50 fixo, determinar C(s) e, em seguida, avaliar o seu desempenho para os 
demais valores do ganho. Observe que, para k = 50, a largura de faixa de F(s) 
é W = 20 [kHz] e que os polos de Fsem(s) são soluções da equação característica 
1+ C(s)Asem(s) = 0. 

Esse projeto envolve dois atributos importantes do sistema em malha fechada, 
a saber, margem de fase e largura de faixa. O ponto mais importante a ser obser- 
vado é que, segundo a equação (4.15), a largura de faixa W e a frequência wg que 
define a margem de fase estão relacionadas entre si por W = 3wg/2. Além disso, a 
função de transferência C(s) Asem(s) é de fase mínima e assim o seu módulo define 
completamente a sua fase a qual, aproximada pelas assíntotas, satisfaz a condição 


ZC(jw) Asemljw) ~ A 90° (4.65) 


onde n é a declividade de |C (jw) Asem(jw)| medida em [dB/dec]. Isto permite definir 
a seguinte regra padrão para se obter uma boa margem de fase, geralmente acima 


de 45º: | 


o Regra padrão : Na década em torno da frequência wg, o controlador C(s) 
deve impor uma declividade de —20 [dB/dec] em |C (Jw) Asem (jw). 
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A partir destas considerações, adotamos os seguintes passos para determinar um 
controlador da forma requerida, isto é, com função de transferência, 


= pis +l 
Gea. 


C(s) (4.66) 


a ser sintetizada pela impedância Z(s) desde que Ty > Ty, condição para que C(s) 
seja do tipo atraso e (4.64) possa ser efetivamente resolvida. 
1. Com Wsem = W = 20 [kHz], determina-se wg = 2Wsem/3 = 13,3 [kHz]. 


2. Escolhendo r7! ~ 77! = 1 [kHz] verifica-se que |C (jw)Asem(jw)| tem declivi- 
dade —20 [dB/dec] no intervalo (77 !,07!). Note que wg deve pertencer a este 
intervalo de frequências. 


3. À constante de tempo Ty é determinada para que |C(jwç) Asem(Jwg)| = 1. 
Usando as assíntotas do diagrama de Bode, isso é conseguido impondo-se 
al Ao 
ho! =i 4.67 
WEL aj, A 


que permite determinar Ty = RR = 0,15 [s]. Verifica-se imediatamente que 


Ty > Tx, bem como wg pertence ao intervalo (6,66;5 x 10%) [Hz]. 


Portanto, no final deste procedimento temos em mãos o controlador do tipo atraso 
calculado para k = 50, ou seja 


0,001s + 1 


C(s) = 0,02 
0,15s+1 


(4.68) 
que deve satisfazer todos os critérios de desempenho anteriormente estabelecidos. 
Para se ter uma medida daquilo que foi conseguido, mesmo com as diversas aproxi- 
mações adotadas, os valores exatos das seguintes variáveis foram calculados como 
sendo Wsem = 17,7 [kHz], wg = 12,9 [kHz] e MF = 75º. A redução de aproximada- 
mente 10% na largura de faixa é compensada pelo aumento significativo da margem 
de fase. 

A Figura 4.12 mostra os diagramas de Bode de módulo das funções de trans- 
ferência F(s) e Fsem(s) para k = 50. A linha tracejada mostra o módulo de F(jw) 
enquanto que a linha contínua mostra o módulo de Fsem(Jw), ambos expressos em 
[dB]. Nota-se a perfeita concordância entre ambos em baixas frequências bem como 
a ligeira redução da largura de faixa da segunda em relação à primeira. 
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Figura 4.14: Amplificador modificado 


H 
Ee entrada do amplificador operacional da Figura 4.11. Embora os critérios de desem- 


penho tenham sido atendidos, a impedância de entrada do amplificador não é mais 
infinita o que é altamente indesejável na prática. Isso foi feito de maneira proposital 
para poder colocar em evidência que o mesmo projeto pode ser realizado com o cir- 
cuito esquematizado na Figura 4.14, o qual não sofre desta deficiência. De fato, as 
equações que regem seu comportamento podem ser escritas na forma às = kC (s)ôe, 
de = Asem(8)(de — da) € da = ktôs, onde C(s) é dada por 


COZ 
Ry(Ri+ Ro + Z) + (Ri + R9)Z 
RzCzs+ 1 
(Ry + Re + ReRy/(Rı + R2))Czs + (1 + Ry/(Rı + R2)) 
RCrs +1 
(Ry + Re)Crs+1 


Figura 4.12: Resposta em frequência 


Gore E 


= br 


kt 


(4.69) 


idacã dif tes ganhos E ais 
Figura 4.13: Validação para diferentes & onde a segunda igualdade decorre do fato de termos escolhido a impedância Z cons- 


tituída por um resistor em série com um capacitor, dada por (4.61) e a terceira 
igualdade decorre de uma aproximação válida desde que Ry/(Rı + R2) < 1. Como 
para implementar um ganho k > 1 qualquer é necessário apenas impor um valor para 
a relação Ry/Ro, esta última condição pode ser sempre satisfeita, para qualquer Ry. 
Note que, como anteriormente, a equação (4.69) produz um controlador do tipo 
atraso. Por outro lado, usando as relações extraídas do circuito da Figura 4.14, 
obtemos a relação entre entrada e saída como sendo 


TR C(s) Asem(s) 5 
3 1+C(S)Asem(s)) 


Como C(s) foi determinado para o valor nominal k = 50 do ganho do amplifi- 
cador, resta verificar o seu comportamento em função deste parâmetro variando no 
intervalo k € (1,100). Na Figura 4.15, 0 gráfico à esquerda mostra a largura de aa 
de Fsem(5) em relação àquela produzida por F(s), isto é, Wsem/W. O gráfico à di- 
reita mostra a margem de fase. Podemos concluir que o desempenho do controlador 
C(s) projetado para o ganho nominal é bastante adequado para todo k € (10, 100). 
| Finalmente devemos discutir alguns aspectos relativos à implementação do con- 
trolador nominal C(s) dado em (4.68). Qualquer ganho k no intervalo desejado pode 
ser implementado adotando-se Rı = kR e Ro = kR/(k — 1), com R arbitrário. Para 
R = 1 [MQ], as relações (4.64) fornecem Cz = 150 [nF] e Rz = 6,7 [k9]. 

Um outro aspecto muito relevante diz respeito à impedância Z(s) colocada na 


(4.70) 


fazendo com que a função de transferência em malha fechada seja idêntica à Fsem(S) 
j j e e ~ A ° 
dada em (4.60). Assim sendo, impondo-se a função de transferência do controlador 
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C(s) da forma (4.66), o projeto para a nova estrutura é idêntico ao anterior. A 
única diferença, irrelevante, é como a valores das resistências e da capacitância são 
extraídos de C(s) definida pelas constantes de tempo Te = RyCr e Ty = (Ry + Rz)Cr. 
Uma solução possível é dada por 


— T 
QE , R= EN O, Aa] 
By Co y= Ta o am 


onde Ry é qualquer mas deve satisfazer a condição Ry/(Rı + R2) < 1. Com os 
valores numéricos utilizados anteriormente, adotando-se Rı = kR e Ro = kR/(k-—1), 
com R = 1 [MQ] e R, = 100 [k9], as relações (4.71) fornecem Cz = 1,5 [uF] e 
Rz ~ 67,0 [k9]. Neste caso, Ry/(Rı + Ro) = 1/10k < 0,01 para todo k € (10,100), 


o que mantém a aproximação dentro de uma precisão adequada de 1%, no pior caso. 
4.7 Notas Bibliográficas 


Neste capítulo discutimos e propusemos várias técnicas que julgamos as mais 
essenciais para serem aplicadas em projetos de sistemas de controle. Inicialmente, 
retomamos os critérios de desempenho mas agora no domínio da frequência para, 
em seguida, introduzir os importantes conceitos de margem de ganho e margem de 
fase e, finalmente, os critérios de desempenho em regime permanente levando à ca- 
racterização dos tipos de sistemas. Estes temas são tratados em praticamente todos 
os livros de controle, com maior ou menor ênfase em determinados aspectos, como 
se pode verificar nos textos [2], [7], [15], [25] e [30]. A alocação de polos baseada 
na solução da equação Diofantina é discutida em [2], porém, neste capítulo, foi feito 
um esforço para generalizar esse procedimento e projetar controladores de ordem 
reduzida. Esse aspecto não é encontrado no demais livros textos. Os controladores 
clássicos e a regra de Ziegler-Nichols foram analisados dentro de uma visão unifi- 
cadora destes temas. O capítulo é concluído com dois projetos que são apresentados 
em detalhes. O primeiro trata do controle Potência ativa - frequência em sistemas 
de geração de energia elétrica, utilizando o modelo clássico inicialmente proposto 
em [12] e também tratado em [31]. O segundo enfoca o projeto de amplificadores 
operacionais realimentados com margem de fase garantida, ver [6], [29] e [34]. Além 
dos projetos em si, importantes aspectos relativos à implementação prática de cada 
um são discutidos. Como pode ser verificado, várias partes deste material não são 
encontradas em outros livros de controle disponíveis na literatura. 
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4.8 Exercícios 
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Exercício 4.1 Considere as funções de transferência dadas a seguir e, a partir de sua 
resposta em frequência estime o pico máximo do diagrama de Bode de módulo e a largura 
de faixa, utilizando a aproximação de segunda ordem e em seguida compare com os valores 


obtidos via simulação numérica. 


to = SE+D E 425(s + 10) 
UEC aC 4 (8) = Toa + a 10s 545) 
0 8+% 4250(s + 1) 

b) G(s) = — Jee a RE EE 
J G(s) 4(82 44845) f) G(s) (s + 10)(s2 + 10s + 425) 
| o=o Aoo 272(s + 100) 

c) G(s) = a o OEE 
PE (s + 1)(s2 + 4s + 40) A 5(s + 20)(s? + 85 + 272) 

Dé 400 h) O(s) = 1360(s + 20) 


(s + 10)(s2 + 45 + 40) 


(s + 100)(s2 + 8s + 272) 


Exercício 4.2 O diagrama de Bode assintótico de módulo de um sistema de fase mínima, 
denotado pela função de transferência G(s), e a estrutura de controle em malha fechada estão 


representados na Figura 4.15. Sabendo que G(s) apresenta dois polos complexos conjugados 
com fator de amortecimento 0,7: 


—40 dB/dec t “oi Hey 


12 dB 


| 


—60 dB/dec 
10 rad/s 100 rad/s 


Figura 4.15: Diagrama de Bode em malha aberta e estrutura em malha fechada. 


a) Estime, para k = 1, a margem de fase, a margem de ganho e calcule as constantes de 
erro Kp, Ky e Ka associadas ao sistema em malha fechada. 


b) A partir dos valores encontrados no item anterior, determine o valor do ganho Kose > 0 
de modo que o sistema em malha fechada permaneça estável. 


Exercício 4.3 O diagrama de Bode assintótico de módulo de um sistema de fase mínima, 
denotado pela função de transferência G(s), e a estrutura de controle em malha fechada 
estao representados na Figura 4.16. Sabendo que todos os polos e zeros de G(s) são reais: 
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—20 dB/dec 
f 
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| —40 dB 
2 rad/s 200 rad/s 
Figura 4.16: Diagrama de Bode em malha aberta e estrutura em malha fechada. 


— aroem de ganho e calcule as 
a) Estime, considerando k = 1, a margem de fase e a marg o ; 
constantes de erro Kp, Ku e Ka associadas ao sistema em mana jec 


b) Determine os valores de k > O de modo que a margem de fase do sistema sega Mator 


ou igual a 45°. 


Exercício 4.4 Considere um sistema de controle com realimentação unitária, segundo a 
Figura 4.17, cuja planta é dada por 

1 
(s + 1)(s + 10) 


; ; 
= at ga 


Figura 4.17: Sistema com realimentação unitária. 


G(s) = 


a) Para C(s) =% > 0, expresse os erros de regime, em função do tempo, para as seguintes 
entradas ri(t) = A, rolt) = At e r3 (t) = At?, Vt>0. Em seguida, determine FO 
para que o tempo de estabilização do sistema em malha fechada seja minimo. 


b) Utilizando um pacote computacional, verifique se a aproximação via polos dominantes 
para o sistema em malha fechada é válida. Altere o ganho r > O e verifique 0 que ocorre 
com o tempo de estabilização do sistema em malha fechada. E possível determinar 


outro ganho que melhore o tempo de estabilização ? 
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c) Com o controlador projetado no item b), calcule a margem de fase, a margem de 
ganho e a largura de faixa do sistema em malha fechada. 


d) Utilizando um controlador proporcional, é possível que o erro relativo a uma entrada 
do tipo degrau seja menor ou igual a 5%? 


Exercício 4.5 Com relação à planta do Exercício 4.4, deseja-se projetar um controlador 
C(s) de modo que o sistema em malha fechada apresente tempo de estabilização próximo 
ao valor encontrado anteriormente e que o erro relativo a uma entrada do tipo degrau não 
ultrapasse 5%. 


a) Para atendermos a especificação sobre o erro de regime podemos utilizar um contro- 
lador PI. Projete o controlador PI utilizando a regra de Ziegler-Nichols e verifique se 
as especificações sobre o transitório foram atendidas. 


b) Refaça o projeto do controlador PT alocando o zero do controlador de modo a cancelar 
o polo em —1 da planta. Em seguida, imagine que o cancelamento entre o polo e o 
zero não é perfeito. Utilizando um pacote computacional, verifique o efeito de haver 
um erro de 10% no valor do polo da planta para o projeto realizado. 


c) Projete um controlador C(s) = ke AE do tipo atraso de modo que o zero do controlador 
cancele o polo da planta em —1 e aloque convenientemente o polo do controlador. A 
seguir, verifique utilizando um pacote computacional se as especificações foram aten- 


didas e analise os efeitos de um cancelamento imperfeito entre polo e zero. 


d) Projete o controlador C(s) alocando os polos dominantes do sistema em malha fechada 
nas posições encontradas no exercício 4.4 e os não dominantes com, pelo menos, 4 
constantes de tempo mais rápidas e resolva a equação Diofantina. Nesse projeto, 
imponha que o erro em regime para a entrada degrau seja nulo. 


Após finalizado cada projeto, determine as margens de ganho e de fase e a largura de faixa 
do sistema em malha fechada. 


Exercício 4.6 Denotando por W a largura de faixa do sistema de controle em malha 
fechada projetado no exercício anterior, implemente os controladores PI e atraso projetados 
no Exercício 4.5 utilizando um segurador de ordem zero. Faça as implementações utilizando 
as frequências de amostragem W, 5W, 10W, 20W e 30W e compare os desempenhos de 
cada implementação com o desempenho do controle a tempo contínuo. Utilize um pacote 
computacional para realizar esta tarefa. 


Exercício 4.7 Considere o sistema de controle em malha fechada representado na Figura 
4-17, no qual a planta G(s) é definida por 


Oel) 
tus sls +2)(s +3) 


Supondo que se queira utilizar um controlador proporcional C(s) = k > 0: 
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a) Calcule as constantes de posição (Kp), de velocidade (Ku) e de aceleração (Ka) e os 
erros em regime permanente para entradas do tipo degrau, rampa e parábola unitários. 


b) A partir das respostas do item a ), qual a melhor escolha para o ganho K considerando 
apenas o desempenho em regime permanente? Qual a consequência dessa escolha no 
comportamento do sistema em malha fechada durante o transitório ? 


c) Projete C(s) = Rm > 0, de modo a minimizar o tempo de estabilização e, a partir 
desse valor, calcule o erro à rampa unitária e estime a margem de ganho, a margem 
de fase e a largura de faixa do sistema em malha fechada. 


Exercício 4.8 Dada a planta G(s) do Exercício 4.7, deseja-se que a saída y(t) do sistema 
em malha fechada representado na Figura 4.17 apresente as seguintes características: 


e Erro em relação à rampa unitária inferior a 0,1. 
e Tempo de estabilização menor ou igual a 4 |s]. 


e Máximo pico para uma entrada degrau igual a 30%. 


a) Verifique se o controlador C(s) = Km projetado no Exercício 4.6 é capaz de atender 
a todas as especificações. 


b) Delimite no plano complexo a região Q em que os polos do sistema em malha fechada 
devem permanecer para atender as restrições sobre o transitório de y(t). 


c) Utilizando o lugar das raízes, projete um controlador C(s) = ke(s + z) do tipo pro- 
porcional-derivativo escolhendo adequadamente a região da reta real em que se deve 
alocar seu zero e, em seguida, determine o valor do ganho k de modo a alocar conve- 
nientemente os polos dominantes do sistema em malha fechada. Finalmente, verifique 
se o valor encontrado satisfaz a restrição sobre o transitório. 


s+z 


d) A partir do controlador PD obtido no item c), projete um controlador C(s) = ke go 
do tipo avanço de modo a garantir os critérios de desempenho impostos. Mantenha o 
zero do controlador avanço igual ao do PD, aloque convenientemente o polo do novo 
controlador, de modo a não alterar em demasia as características do lugar das raízes 
na região de interesse e ajuste adequadamente o ganho ke. 


Após finalizado cada projeto, determine, utilizando um pacote computacional, as margens 
de fase e de ganho e a largura de faixa do sistema em malha fechada. 


Exercício 4.9 Denotando por W a largura de faixa do sistema de controle em malha 
fechada projetado no Exercício 4.8, implemente os controladores PD e avanço discretizados 
utilizando um segurador de ordem zero. Faça as implementações utilizando as frequências de 
amostragem W, 5W, 10W, 20W e 30W e compare os desempenhos de cada implementação 
com o desempenho do controle a tempo contínuo. Utilize um pacote computacional para 


realizar essa tarefa. 
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Exercício 4.10 Com relação ao projeto de um controlador para a função de transferência 
dada no Exercício 4.7, qual a consequência de se utilizar um controlador do tipo PI a fim 
de zerar o erro para uma entrada rampa? E se utilizarmos um controlador do tipo atraso? 
De um modo geral, qual a consequência de adicionarmos um polo em frequência mais baixa 
que a do zero de C(s)? 


Exercício 4.11 Considere um sistema de controle com realimentação unitária, segundo 
a Figura 4.17, cuja planta é denotada pela função de transferência 


250 


e assa 


a) Considerando um controlador proporcional C(s) = kp > 0, calcule os erros em regime 
permanente para entradas degrau, rampa e parábolas unitários em função de kp. Para 


kp € {0,1;1; 10}, estime as margens de fase e de ganho do sistema em malha fechada 
e conclua sobre sua estabilidade. 


b) Utilizando a regra de Ziegler-Nichols projete um controlador C(s) do tipo PID e estime 
a margem de fase e a largura de faixa do sistema em malha fechada, bem como o valor 
do erro em regime para a rampa unitária. 


c) Supondo que o controlador C(s), de acordo com a estrutura da Figura 4.17, deva 
garantir que o sistema em malha fechada atenda as seguintes especificações: 
e Erro para uma entrada rampa unitária menor ou igual a 0,1. 
e Margem de fase de, no mínimo, 30º. 
e Largura de faixa em torno de 100 [rad/s]. 


verifique se um controlador proporcional C(s) = kp > O é capaz de atendê-las. A 
seguir, analise se o controlador PID projetado no item b) satisfaz as especificações. 


d) Utilizando um controlador do tipo proporcional-derivativo verifique se é possível sa- 
tisfazer os critérios de desempenho. Em caso negativo proponha uma maneira de 
contornar o problema encontrado. 


e) Refaça o projeto do item anterior empregando controladores do tipo avanço. 


Em todos os itens anteriores, utilize um pacote computacional para validar os projetos reali- 
zados. 


Exercício 4.12 Considere a planta 


Co s42 
“= ET 


para a qual deseja-se projetar um sistema de controle com realimentação unitária, segundo 
a Figura 4.17. 


sa 
Ef 
É 

f 

| 

f 

| 
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h 
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E 

| 
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| 
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a) Calcule um controlador proporcional C(s) = kp > 0 de modo que o tempo de estabi- 
lização do sistema em malha fechada seja de, no máximo, 4 |s] e calcule o erro em 
relação a uma entrada do tipo rampa unitária. 


b) Deseja-se projetar um controlador C(s) de modo a satisfazer as seguintes especi- 
ficações: 
e o erro em relação à rampa não superior a 5%. 
e o tempo de estabilização próximo a 4 [5]. 


e a atenuação em altas frequências de —40 [dB/dec). 


A partir das especificações dadas, determine a estrutura do controlador que deve ser 
utilizado e calcule-o. Utilize um pacote computacional para validar o projeto realizado. 


Exercício 4.13 Considere o sistema de controle com realimentação unitária apresentado 
na Figura 4.18 | 


f o a 1 Y 
E m o 1 PRE ——————————— e | cem mercememmemmermeremmetçes 
|- e( +5) as 


Figura 4.18: Sistema com dois graus de liberdade. 


a) Determine no plano K x T, para K,T >Ù, sua região de estabilidade. 
b) Se possível, determine k >0 eT >0 de tal forma a satisfazer, simultaneamente, as 
seguintes especificações: 
o tempo de estabilização menor que 1,5 |s]. 
e constante de velocidade maior que 50. 


o fator de amortecimento igual a 0,5. 


Exercício 4.14 Um sistema de controle a tempo contínuo em malha fechada, com re- 
alimentação unitária, apresenta uma planta G(s) de fase mínima cujo diagrama de Bode 
assintótico de módulo é dado na Figura 4.19. O controlador C(s) no diagrama de blocos da 
Figura 4.19 deve ser projetado de modo a garantir: 


e precisão em regime permanente, em resposta a uma rampa, maior que 1%. 
e margem de fase não inferior a 45°. 


e largura de faixa entre 200 [rad/s| e 300 [rad/s]. 
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Figura 4.19: Diagrama de Bode em malha aberta e estrutura em malha fechada. 


a) Para C(s) = kp, determine o valor do ganho de modo a satisfazer a especificação em 
regime permanente e determine o correspondente valor da margem de fase. 


b) A partir do controlador determinado no item anterior, estabeleça a estrutura do con- 
trolador a ser projetado a fim de satisfazer todas as especificações e aloque convenien- 
temente os polos e zeros de C(s). 


Exercício 4.15 Considere um regulador de tensão cuja estrutura é apresentada na Figura 
4-17, com 


10 
CO RES CEO! 
(+) (+35) 
Deseja-se projetar um controlador C(s) de modo que a tensão regulada, dada pela saída y(t), 
seja 2000 + 0,2 [V]. Como especificação do transitório, a margem de fase do sistema não 
deve ser inferior a 35º e deseja-se atenuar os ruídos com frequência superior a 100 |rad/'s). 


a) Partindo de um controlador proporcional C(s) = kp verifique se, ao atender a especi- 
ficação em regime permanente, o transitório do sistema em malha fechada é adequado. 


b) Pensando apenas no comportamento do sistema em regime permanente, projete um 
controlador Cı(s) do tipo atraso de modo a regular a tensão dentro do valor especifi- 
cado. Em seguida, verifique a margem de fase associada ao sistema Ci(s)G(s). 


c) Para satisfazer a especificação da margem de fase, considere o sistema em malha 
aberta dado por Ci(s)G(s) e então projete um controlador Co(s) do tipo avanço de 
modo a adequar o comportamento durante o transitório. Assim, o controlador para o 
regulador de tensão é definido por C(s) = Ci(s)Ca(s). 


d) Verifique qual o efeito de um controlador PID, projetado através da regra de Ziegler- 
Nichols, no comportamento do sistema em malha fechada. 
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Em todos os itens, utilize um pacote computacional para verificar se as especificações do 
projeto foram atendidas. 


Exercício 4.16 Considere a planta 


s—? 


L e 


para a qual deseja-se projetar um sistema de controle com realimentação unitária, segundo 
a Figura 4.11. 


a) Considerando um controlador proporcional C(s) = kp > 0, esboce o lugar das raízes e 
verifique se é possível fazer com que o sistema em malha fechada apresente tempo de 
estabilização menor ou igual a 4 |s]. 


b) Para um controlador do tipo C(s) = ke uso escolha convenientemente z e p e calcule 


ke > 0 para satisfazer a condição de tempo de estabilização menor ou igual a 4 fs]. 


Exercício 4.17 Considere um sistema em malha aberta instável, representado pela função 
de transferência 


1 
Cos 


Deseja-se projetar um controlador C(s) para que o sistema de controle representado na 
Figura 4.17 possua margem de fase de 70°. 
| 


a) À partir da planta fornecida e das especificações de projeto, qual a estrutura do con- 
trolador que deve ser projetada? 


b) Projete o controlador com a estrutura definida no item anterior e calcule a margem 


de ganho e a largura de faixa do sistema em malha fechada. 


Exercício 4.18 Para o sistema em malha fechada da Figura 4.20, na qual 


= I6(s+2) 
UR 


a) Determine sua função de transferência em malha fechada. 


b) Considerando C(s) = 0,1 e H(s) = s, determine as constantes de erro Kp, Ky e Ka, 
as margens de estabilidade e a largura de faixa do sistema em malha fechada. 


c) Para os controladores C(s) e H(s) dados, determine a saída em regime permanente 
correspondente à entrada r(t) =10+5tYt>0. 


d) Se C(s) = H(s) = 1, é possível calcular o erro em regime para a entrada dada no 
item anterior? 
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H(s) e 


A 


Figura 4.20: Sistema com duas malhas de realimentação. 


Exercício 4.19 Considerando o sistema de controle da Figura 4.20, uma estratégia de 
projeto é calcular H(s) e C(s) em duas etapas, iniciando-se com a malha de realimentação 
mais interna. 


a) Primeiramente, vamos projetar H(s) = kas de modo que os polos assintoticamente 
estáveis da função de transferência da malha de realimentação interna apresentem o 
menor tempo de estabilização possível. Para a malha de realimentação interna, qual 
o erro para uma entrada degrau? 


b) Na segunda etapa de projeto, queremos que C(s) = ke T garanta, para uma entrada 


degrau, um valor de pico em relação à entrada de, no máximo, 15% e tempo de 
estabilização não superior a 10 |s]. Utilize um pacote computacional para verificar a 
qualidade do projeto. 


Exercício 4.20 Um sistema com realimentação unitária e sinal de referência nulo, de 
acordo com a Figura 4.21, tem como função de transferência em malha aberta 


1 


Dnr DES 


Eno 


"so em dt na T 


Figura 4.21: Sistema com realimentação unitária sujeito a ruído de atuação. 


ES 
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a) Deseja-se projetar um controlador C(s) de forma que, para w(t) do tipo degrau, seu 


feito na saída y(t) em regime permanente não ultrapasse 5% da sud amplitude. Calcule 


um controlador C(s) = kp > O que satisfaça esta especificação. É possível utilizar tal 
controlador? 


b) Projete um controlador do tipo C(s) = ke Ate) tett ca) de modo a satisfazer as restrições 


de projeto. Seria possível utilizar um controlador PID? 


c) Supondo um ruído w(t) = sen(100t), qual a atenuação aplicada pelo sistema na com- 


posição do sinal de saída y(t)? 


Exercício 4.21 A Figura 4.22 esquematiza o modelo linearizado do controle automático 
da tensão de um gerador síncrono, no qual a tensão de saída do gerador denotada por 
Vit) deve estar dentro de certos limites em relação à tensão de referência V, (t). Considere 
inicialmente que Ad(t) = 0. 


c) 


d) 


Aji 


E o a e ! Rá 
1 + 0,45 l+s 


Veo + 1 
e l 6 Ly 
O (8) Ene - 
Controlador Amplificador Atuador Gerador 
l = 
1 + 0,055 
Sensor 


Figura 4.22: Regulador automático de tensão. 


Supondo C(s) = kp, determine os valores de kp > O de modo que o sistema seja 
estável. 


Qual deve ser o valor de kp para que a precisão da tensão de saída Vi(t) seja de 10% 


em relação a uma tensão V,(t) do tipo degrau? 


Determine o valor de kp de modo que o tempo de estabilização do sistema em malha 
fechada seja mínimo. 


Projete um controlador C(s) do tipo PID de modo a garantir que o tempo de estabi- 
lização de Vi(t) não ultrapasse 2 |s] e que seu valor de pico, para uma referência do 
tipo degrau, seja menor que 15%. 
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Exercício 4.22 Com relação ao problema de regulação automática de tensão tratado no 
Exercício 4.21, percebemos pelo diagrama de blocos da Figura 4.22 que uma variação no 
ângulo de potência do gerador síncrono, denotada por Ad(t), afeta a tensão de saída Vi(t). 


a) Para uma variação de Aó(t) = 0,05 calcule a variação correspondente na tensão de 
saída Vi(t) em função de C(s) = kp e determine o valor de kp > O que minimiza a 
influência do distúrbio em regime permanente. Qual a consequência para o compor- 
tamento da tensão de saída durante o transitório? 


b) Recalcule a variação que o distúrbio Ad(t) = 0,05 causa na saída Vi(t) em regime 
permanente para o controlador C(s) projetado no item d) da questão anterior. 


Capítulo 5 


Projeto via Representação 
Estado 


5.1 Introdução 


Até agora, projetamos controladores, traduzindo as especificações de projeto nas 
posições em que os polos dominantes do sistema em malha fechada devem ser alo- 
cados, o conjunto Q. Inicialmente, fixamos a estrutura do controlador e calculamos 
posições adequadas para seus polos, a fim de respeitar o desempenho durante o 
transitório. Por fim, o ajuste do ganho através do lugar das raízes permitiu melho- 
rar a solução mantendo o comportamento em regime permanente. Entretanto, com 
essa técnica, não temos atuação eficaz sobre a posição dos polos não dominantes em 
malha fechada, o que pode levar a comportamentos da saída controlada que não são 
exatamente os especificados. 


Essa dificuldade na alocação de todos os polos de um sistema de controle em 
malha fechada pode ser contornada aumentando-se o número de parâmetros do 
controlador, isto é, aumentando a sua complexidade. Neste capítulo, abordamos o 
projeto de controladores no contexto de espaço de estado e estudamos como alocar 
convenientemente os polos de um sistema em malha fechada, como uma alternativa 
à resolução das equações Diofantinas. O ponto central é a solução de um problema 
de controle ótimo, denominado problema linear quadrático, cujo critério é ajustado 
através de um lugar das raízes específico, simétrico em relação ao eixo imaginário 
do plano complexo. 
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5.2 Realimentação de Estado 


Consideramos, como nos capítulos anteriores, um sistema em malha aberta 
definido pela relação entre a sua entrada ĝ e a sua saída % através da função de 
transferência 

n a 
dui=o dis! 
G(s) = EE 
Dui=o 4s 
1=0 “2 
onde, sem perda de generalidade, assumimos que a, = 1. Essa função de trans- 
ferência é dita estritamente própria quando bn = 0 e própria se bn + 0. Em ambos 
os casos, temos interesse em reescrevê-la na seguinte forma alternativa 


E bi — n A i i 
G(s) = ui=o Dis! — bn Dojo US 


(5.1) 


b 
Mimo US! = 
S io(b — bnai)s' ES, 
2 i= US! : 
cs! 
== 
onde m < n—l1 ec; = bi—bna; para todo i = 0,---,m. Ou seja, a ordem do polinômio 


numerador torna-se estritamente menor dò que a ordem do polinômio denominador 
pois, por construção, o coeficiente do seu termo de maior grau é nulo, isto é Cn = 
bn — bnan = O. Esta é a forma conveniente para se obter a sua representação de 
estado. De fato, com (5.2) a relação y = G(s)ĝ, se escreve 


m 
ĝ = ss cs) n + bad (5.3) 
1=0 


onde a variável auxiliar 1 é definida por 


[> o) ñ= ĝ (5.4) 
1=0 


portanto, calculando a transforma de Laplace inversa, é possível expressar estas 
mesmas relações no domínio do tempo envolvendo a variável auxiliar que acabamos 
de introduzir. Sob condições iniciais nulas, obtemos 
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sendo que n(t) satisfaz a equação diferencial 
é . 
> am (o) = g(b) (5.6) 
i=0 


o que permite concluir que a saída y(t) é dada pela combinação linear da entrada 
g(t) e das derivadas sucessivas de n(t), que é a solução da equação diferencial (5.6). 
Definindo como variáveis de estado n(t) e suas derivadas sucessivas até ordem n — 1, 
ou seja, x; 1(t) = nt) (t) para todo i = 0,:::,n — 1 como sendo as componentes do 


vetor de estado 
nt) (t) 


() 
ate É = ER" (5.7) 


ne (8) 
a sua derivada em relação ao tempo fornece a chamada equação de estado 


t = Ax+ Bu (5.8) 
= Gr Du 


onde, para seguir a nomenclatura padrão, a entrada foi denotada u(t) = g(t) e as 
matrizes A € R”*”, B e R”*t, C e R!*” e D eR são dadas por 


0 1 0 0 0 
0 0 1 0 0 
MZ. do AR x pB o (5.10) 
0 0 0 1 0 
—G —aı —a2 —ün—1 1 
G e [co C1 CO ter Cm O > 0| ; D= bn (5.11) 


Neste ponto, cabem algumas considerações. Em primeiro lugar, condições iniciais 
não nulas podem ser incluídas impondo-se o valor do vetor de estado no instante 
inicial t = 0, isto é, x(0) = xo € R”. Tendo sido fixada a condição inicial, a solução 
de (5.8) é única 


t 
r(t) = e“txo + | e^lt-7) Bu(T) dr (5.12) 
0 


Em segundo lugar, tendo em mãos a representação de estado, podemos imediata- 
mente recuperar a função de transferência que a originou. De fato, uma vez mais, 
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sob condições iniciais nulas, a transformada de Laplace, aplicada em (5.8) e (5.9), 
fornece ĉ = (sI- A) 1 Bù e ĝ = Ci+ Dû, sendo que a primeira igualdade substituída 
na segunda resulta em y = G(s)û, com 


G(s)=C(sI-AJ!B+D = (5.13) 


Ademais, lembrando dos resultados referentes ao cálculo de polos e zeros de funçoes 
racionais introduzidos no Capítulo 3, a comparação de (5.13) com (5.1) nos leva à 
conclusão de que 


det(sI — A) = N ajs | (5.14) 
i=0 


indicando que o polinômio característico da matriz A é igual ao polinômio denomi- 
nador da função de transferência G(s). Portanto, os polos de G(s) são as raízes de 
det(sI— A) = 0, que nada mais é que a equação característica da equação diferencial 
(5.8), ou ainda a equação característica da matriz A. Por outro lado, temos também 


det | C D | = D (5.15) 


que indica uma maneira alternativa de definir e calcular os zeros de G(s). Final- 
mente, em terceiro lugar, a representação de estado de uma função de transferência 
não é única. De fato, considerando T € Rº*” uma matriz não singular qualquer, 
definindo um novo vetor de estado % = Tz, as equações (5.8) e (5.9) são escritas na 


forma equivalente 


TATI + TBu (5.16) 
CT! + Du (5.17) 


Re 
| 


cuja função de transferência pode ser calculada como anteriormente, ou seja, aplican- 
do-se a transformada de Laplace sob condições iniciais nulas, para obter 


H(s) = CT I(sI-TATI) TB+D 
- CT M(T(sI-AT!) TB+D 
C(sI- A) +B +D (5.18) 
A igualdade H(s) = G(s), que acabamos de obter, mostra que uma função de 


transferência admite um número infinito de representações de estado, ligadas umas às 


5.2. REALIMENTAÇÃO DE ESTADO 173 


outras por uma transformação linear do tipo % = Tx, denominada transformação de 
similaridade. A transformação de similaridade pode ser usada para obter equações de 
estado com uma estrutura mais conveniente. Por exemplo, para uma classe bastante 
ampla de matrizes A € R"*”", que inclui todas aquelas com autovalores distintos, 
existe uma transformação de similaridade de tal forma que TATT! = A, onde A é 
uma matriz diagonal. Essa propriedade, aliás, permite dar uma prova simples para o 
chamado Teorema de Cayley-Hamilton, cujo enunciado bastante conhecido é: Toda 
matriz quadrada satisfaz a sua equação característica. 


Teorema 5.1 Sendo det(sI — A) =>“ quis! o polinômio característico da matriz 
quadrada A € Rº*”, então 


n 

> aA'=0 (5.19) 

i=0 | 
Prova : Embora esse resultado seja válido para qualquer matriz quadrada, a 
prova dada a seguir se restringe à classe de matrizes que podem ser diagonalizadas 
através de uma transformação de similaridade. A relação TATT! = A com, À 
diagonal, implica que A = diag(Ay,:-- , An) é uma matriz diagonal composta com os 
autovalores de A pois det(sI— A) = det(sI— A). Por outro lado, como TAT} = Aº 
para todo à > 0 temos 


n 


>, a; A! 


1=0 


é [> aa) T 
i=0 
= A) (5.20) 


pois cada elemento da matriz diagonal 3.4 a;A* é igual a Da aià} = 0 para todo 
1 < j <n, o que prova o teorema proposto. m 


Com a representação de estado (5.8)-(5.9) da função de transferência do sistema 
em malha aberta G(s), podemos tratar do projeto de realimentação de estado cujo 
diagrama de blocos está esquematizado na Figura 5.1. 

As matrizes de ganho M E R"*Xl e K e R!*” são as incógnitas a serem determi- 
nadas. Devemos observar a realização via variáveis de estado de G(s) e a hipótese 
de que todo o vetor de estado z(t) € R” está disponível para realimentação. Ex- 
plicitamente, isso requer que todas as variáveis de estado sejam medidas em todo 
instante de tempo t > 0, hipótese que será eliminada mais a frente. Com aquele 
diagrama de blocos, a lei de controle se escreve na forma 


u(t) = K(Mr(t) — x(t)) (5.21) 
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Figura 5.1: Realimentação de estado 


onde r é a referência para a saída y enquanto que Mr é a referência para o estado 


como um todo x. Consequentemente, o sistema em malha fechada é definido pelas 
equações 


t = (A-BK)z+BKMr, x(0) = zo (5.22) 
= (C-DK)x+ DKMr (5.23) 


cuja função de transferência é escrita da forma F(s) = S(s)KM, onde 


S(s)=(C-DK)(sI-(A-BK)) B+ D (5.24) 


é uma função de transferência escalar que depende exclusivamente do ganho K € 
Rix" o que permite as seguintes considerações: 


e A matriz de ganho K é determinada de tal forma a alocar os polos do sistema 
em malha fechada em posições adequadas no plano complexo, isto é, no interior 
de um conjunto Q determinado de acordo com critérios especificados no projeto 
que levam em conta o desempenho durante o transitório. 


e À determinação de K define completamente a função de transferência S (s). 
Podemos então calcular a matriz M de tal forma a assegurar um determinado 
desempenho em regime permanente. 


Esse procedimento é dividido em duas etapas completamente distintas. Primeiro o 
ganho K é calculado para posicionar os polos do sistema em malha fechada e, em 
seguida, determina-se o ganho de referência M procurando estabelecer um desem- 
penho adequado em regime permanente. 
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A primeira etapa, denominada problema de regulação, resume-se, no presente 
contexto, em determinar K de tal forma que os polos de F(s) e, portanto, de S(s), 
soluções da equação característica 


det (s1 AA BK) ) =0 (5.25) 


estejam localizados no interior de Q dado. Inicialmente, considerando que as ma- 
trizes A e B são aquelas com a estruturas apresentadas em (5.10) e 


K= [fki kz vm kn| € RO (5.26) 


de tal forma que simples cálculos permitem determinar 


0 1 0 0 
0 0 Í 0 
A-BK= | e - (5.27) 
| 0 0 0 e 1 
=a =k armek mamek 00 i koa 


Como a estrutura de A — BK é idêntica à estrutura de A e os elementos da sua 
última linha são alterados de —a; para —a; — ki+ı para todo i = 0,- ,n— 1, a 
igualdade (5.14) nos leva imediatamente a 


n—l 


det(sI —(A— BK) ) = s” + 5 (as + kiyı)s' (5.28) 
1=0 
Portanto, dado um conjunto Q, se escolhermos n pontos s1,---,Sn localizados no 


seu interior, determinamos o polinômio 


Py = TI6 - si) = s” + Sns (5.29) 
i=0 


i=1 
de tal forma que o ganho de realimentação de estado dado por 


K= [po — O PpPı—aı cc Pn-1— Gigil ER” (5.30) 


assegura que os polos do sistema em malha fechada são as raízes de P(s) = 0. A 
maneira como esse resultado foi obtido deixa claro que, para qualquer polinômio 
P(s) dado, sempre é possível determinar um ganho constante de realimentação de 
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estado, de tal forma que os polos do sistema em malha fechada sejam as raízes de 
P(s) = 0. Deve também ficar perfeitamente claro que o ganho de realimentação K, 
que acabamos de determinar, só é válido quando as matrizes A e B estiverem na 
forma canônica apresentada em (5.10). À boa técnica de projeto via realimentação 
de estado resume-se em escolher as raízes do polinômio P(s), de modo que os polos 
dominantes do sistema em malha fechada apresentem as características desejadas da 
resposta transitória. Com relação aos demais polos, eles devem estar suficientemente 
afastados, à esquerda, dos polos dominantes. 

Podemos, agora, abordar a segunda etapa. Ou seja, determinar o ganho M para 
assegurar um desempenho adequado em regime permanente em termos de seguir 
com erro nulo um degrau unitário f(s) = 1/s. Como g(s) = F(s)r(s) e F(s) é 
assintoticamente estável, o erro em regime permanente para essa entrada será nulo 
desde que a função de transferência em malha fechada F(s) satisfaça a condição 
F(0) = 1. Entretanto, lembrando que F(s) = hS(s) com h = KM e que, após 
a determinação do ganho K, a função S(s) é conhecida, a condição F(0) = 1 se 
escreve na forma 


S(0)h = 1 (5.31) 


onde, com (5.24) temos 
S(0) = (DK —- C(A- BK) !B+D (5.32) 


sendo que a existência da inversa de (A— BK) está assegurada pelo fato de K posi- 
cionar todos os seus autovalores em uma região Q contida no interior do semiplano 
esquerdo complexo. É claro que (5.31) determina h = 1/S(0) mas, em seguida, é 
preciso calcular M e R”X!, de tal forma que KM = h, que é uma equação linear 
com n variáveis, a qual consequentemente admite soluções múltiplas. Como fizemos 
no Capítulo 4, a solução de menor norma Euclidiana é dada por 
K' 

M = ha (5.33) 
Neste ponto, é importante ressaltar que a matriz de ganho M e R”*! só intro- 
duz um grau de liberdade para gerar um escalar h € R. Isso implica em algumas 
limitações. Por exemplo, se desejarmos seguir uma rampa unitária, devemos impor 
F(0) = hS(0) = 1 e F(0) = AS“(0) = 0, o que é impossível pela escolha de h e, con- 
sequentemente, de M, a menos que o ganho K pudesse ter sido obtido de tal forma 
que S'(0) = 0. Isto mostra que, para considerar as demais funções de referência 
padronizadas ?(s) = 1/s* com k > 2, é necessário introduzir uma modificação im- 
portante. O escalar h deve se tornar uma função de transferência h(s) a determinar, 
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t [s] 


Figura 5.2: Simulação temporal da realimentação de estado 


de tal forma que 
K' 

M(s) = hls) Tera (5.34) 
permita obter F(s) = h(s)S(s). Impondo-se as derivadas sucessivas de F(s) em 
s = 0, determinamos as derivadas sucessivas de h(s) em s = 0 o que torna viável, 
através de (5.34), a determinação de M (s). 

=- O exemplo a seguir ilustra os resultados teóricos que acabamos de introduzir e 
dá uma ideia do que ocorre quando tentamos alocar os polos muito distantes do eixo 
imaginário. Deve-se esperar que os ganhos de realimentação K e de referência M 
aumentem quando desejamos fazer com que o sistema responda mais rapidamente. 
Esse exemplo também será usado para ilustrar um projeto com sinal de referência 
do tipo rampa unitária. 


Exemplo 5.1 A função de transferência do motor de corrente contínua já tratado anteri- 
ormente pode ser escrita na forma 


0,0714 


ERA A e 
(9) = 2 1074s 401429 


cuja representação de estado é dada por 


no 0 PEN 
à a o a aA 
E Guia 


onde x = |v ù|’ é o vetor de estado, u = V é a tensão de entrada e y = v é a velocidade 
angular da carga. Essas equações identificam as matrizes A € R?*”?, B e R?*!, C e RI”? e 


178 CAPÍTULO 5. PROJETO VIA REPRESEN TAÇÃO DE ESTADO 


D = 0. O objetivo é determinar os ganhos de realimentação K € R!*? e M € R?*!, de tal 
forma que o sistema em malha fechada seja assintoticamente estável, acompanhe um degrau 
unitário com erro nulo em regime permanente e não apresente sobre-elevação no sinal de 
saída, em relação a um degrau de entrada, no domínio do tempo. Esse último critério de 
desempenho nos leva a escolher P(s) de segunda ordem com raízes reais. Três casos distintos 
foram considerados sendo que o ganho K foi determinado com (5.30) e M com (5.33): 


1. Pólos em malha fechada definidos por P(s) = (s + 0,25)2. 


—0,2114 
K =| —0,0804 —0,5714 |, M = | “15029 | 
2. Pólos em malha fechada definidos por P(s) = (s + 0,50)2. 
22,6335 
K = | 0,1071 —0,0714 |, M = | -15 0890 | 
3. Pólos em malha fechada definidos por P(s) = (s + 1,00)2. 
7,5171 
K = | 0,8571 0,9286 | , M = | 8/1449 | 


No lado esquerdo da Figura 5.2 mostramos a evolução da saída y(t) em relação ao tempo 
enquanto que, no lado direto, mostramos o sinal de controle u(t). As trajetórias corres- 
pondentes aos casos 1 e 3 estão em linhas tracejadas enquanto que a do caso 2 está em 
linha contínua. O sinal de referência adotado é f(s) = 50/s [rad/s]. Nota-se claramente 
que quanto mais distantes os polos do sistema em malha fechada estiverem dos polos em 
malha aberta, maiores são os módulos dos elementos do ganho de realimentação K. Neste 
exemplo, esse efeito é bastante claro. As simulações incluídas na Figura 5.2 mostram que ao 
alocarmos os polos em malha fechada mais à esquerda, o sistema responde com um tempo 
de estabilização menor. Porém, em contra-partida, a intensidade do controle u(t) aumenta 
de forma expressiva. 

Pode-se verificar facilmente que nenhuma dessas soluções faz com que o sistema em 
malha fechada siga, com erro nulo, uma referência do tipo rampa unitária. Porém, para o 
segundo caso, se adotarmos 


6s+1 22,6335 
K = [01071 —0,0714 ], M(s)= (5 D | —15,0890 | 


o sistema em malha fechada seguirá uma função de referência do tipo degrau e do tipo rampa 
com erros nulos em regime permanente. Com (5.34) temos F(s) = h(s)S(s) e assim as 
condições F(0) = h(0)S(0) = 1 e F'(0) = h'(0)S(0) + A(0)S'(0) = 0 fornecem h(0) = 3,5014 
e h'(0) = 14,0056. Finalmente, considerando h(s) composta por um ganho, um zero e um 
polo localizado no ponto s = —0,5 estas duas condições determinam 


6s+1 


h(s) = 3,5014 


2s+ 1 
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e, por consequência, a função M (s) dada. É importante salientar que, no caso geral, os polos 
de h(s) também são polos de F(s) e, assim, eles devem ser localizados em Q. A introdução 
de um zero adicional em F(s) pode alterar o comportamento transitório da sua resposta ao 
degrau unitário. Portanto, quando o projeto exige apenas que a referência seja um degrau 
unitário, é preferível optar pela solução anterior na qual M é um ganho constante. o 


Um ponto importante a respeito da realimentação de estado, é que os zeros da 
função de transferência em malha fechada não podem ser mudados pela escolha do 
ganho de realimentação de estado K € Ritz". Isso permite entender o motivo pelo 
qual introduzimos a função de transferência M(s) para ser possível seguir com erro 
nulo as referências padronizadas, além do degrau unitário. Como vimos no Capítulo 
3, os zeros de F(s) cuja representação de estado é dada em (5.22)-(5.23) são raízes 
da equação 


det | Á o Pe | = (5.35) 
entretanto, com a fatoração 
sI-(A-BK) Dem |=| "5" Su I 0 | (5.36) 
C- DK DKM C D -K KM 
e KM = h a equação (5.35) se torna 
h det | e a a | = (5.37) 


ou seja, para todo h Æ 0, os zeros de F(s) coincidem com os zeros da função de 
transferência do sistema em malha aberta G(s). A realimentação de estado pode 
alocar os polos de F(s) em posições arbitrárias do plano complexo mas, em contra- 
partida, não altera a posição de nenhum zero. Por outro lado, no caso em que 
forçamos M ser uma função de transferência, os zeros de h(s) = KM (s) também 
são zeros de F(s). A localização adequada dos zeros de h(s) permite eliminar os 
erros em regime permanente para as referências padronizadas. Porém, deve ser mais 
uma vez salientado que os polos de h(s) também são polos de F(s) e assim, devem 
ser escolhidos no interior do conjunto (2. 


5.2.1 Controlabilidade 


Anteriormente, provamos de maneira bastante simples que se as matrizes À € 
RºX" e B e R"X! da representação de estado de uma função de transferência G(s) 
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forem do tipo (5.10), então é sempre possível determinar um ganho de realimentação 
de estado K €e R!*” de tal forma que todas as raízes da equação característica 
det(sI — (A — BK)) = 0 sejam previa e arbitrariamente escolhidas. Em outras 
palavras, dado um polinômio P(s) de grau n com coeficientes reais e coeficiente 
unitário associado ao termo de maior grau, sempre existe K € R!*” que satisfaz a 
igualdade 


det (s7 siie BK)) — P(s) (5.38) 


Infelizmente esta propriedade, denominada Controlabilidade, não é sempre verificada 
e deve, portanto, ser testada para cada sistema dinâmico em estudo. 


Definição 5.1 (Controlabilidade) O sistema dinâmico t = Ax + Bu é dito con- 
trolável se existir um controle da forma u = —Kxzx que possa alocar todos os seus 
polos em posições arbitrárias do plano complexo C. Por simplicidade, diremos que 
o par (A, B) é controlável. 


Como sabemos, as matrizes dadas em (5.10) definem um sistema controlável. 
Por esse motivo, neste caso, a representação de estado (5.8) é denominada forma 
canônica controlável. O lema a seguir estabelece um teste simples para verificar se 
um par de matrizes (4, B) é controlável. 


Lema 5.1 O par (A, B) é controlável se e somente se a matriz 
C=|[B AB ©- AMÍB/|/ ER (5.39) 
denominada matriz de controlabilidade, for não singular. | 


Prova : Se existir uma transformação de similaridade de tal forma que (A, B) = 
(TAT-t, TB) sendo que o par (A, B) está na forma canônica controlável, então o 
par (4, B) é controlável. Com estas relações temos 


Cs [EB TAB ce BAD 
= TC (5.40) 
sendo que uma solução não singular em relação a T existe se e somente se C e C 


forem matrizes não singulares. Neste caso, temos T' = CCT! e a controlabilidade de 
(A, B) implica na de (4, B). O 


Com base nesse resultado, dado um par de matrizes (4, B) quaisquer, se ele 
for controlável, não há grandes dificuldades para se determinar uma matriz K de 
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tal forma a localizar as raízes da equação característica de A — BK em posições 
pré-estabelecidas. Com A, determinamos o seu polinômio característico que é o 
mesmo de Á, bem como o par (A, B) na forma canônica controlável, as matrizes 
de controlabilidade Č, C e a transformação de similaridade T = CC-t. Em epi 
determinamos K para alocar as raízes de A—- BK nas posições dese) E e K = KT! 
é o ganho procurado. De fato, observe que a igualdade A — BK = T (A — BK Nus 
permite concluir que os polinômios característicos de A — BK e de A — BK são 
idênticos. 


Exemplo 5.2 A função de transferência, tratada no Exemplo 5.1, tem uma representação 
de estados alternativa 


à = | 710714 —0,2857 |, [05 
E 0,5 op” oro 
y = [0 0,2857 |z 


na qual identificamos as matrizes (4, B) que, claramente, não estão na forma canônica 
controlável (A, B) obtida no exemplo citado. Calculamos as matrizes de controlabilidade e 
a matriz de transformação 

T- | 0 0,50 | 


0,25 0 
Com K = [| 0,1071 — 0,0714] determinamos o ganho K = |—0,1428 0,4284] que posiciona 
ambos os polos do sistema em malha fechada na posição s = —0,50. o 


A controlabilidade de um sistema dinâmico pode ser interpretada de outra forma. 
Se um sistema dinâmico t = Ax + Bu com condição inicial z(0) = 0 for controlável, 
a sua solução em um instante 7 > 0 é 


nisi / e^lT=8) Bu(E)dE (5.41) 
0 
sendo que uma função que a satisfaz é dada por u(t) = B'e^ 0-9 W7tzr(rT), onde 
We = | e BB'e^ de € RPM (5.42) 
0 


é uma matriz simétrica. E claro que esta solução exige que W. seja uma matriz não 
singular. Considerando v € R” um vetor não nulo, temos 


vW = | veEBB'et dé 
0 


IV 
S 


(5.43) 
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Ro Cs 


Figura 5.3: Circuito com amplificador operacional 


o que indica que We é uma matriz semidefinida positiva e não será definida positiva 
somente se existir v £ 0 € R”, de tal forma que z(t) = B'e4ty = 0 para todo 
t e [0, 7). Como a função z(t) tem que ser nula em um intervalo finito, ela e suas 
derivadas sucessivas calculadas em t = 0 têm que ser nulas, o que leva a 


B'v 
B'A'y 


| 
O 


(5.44) 
Bram, 


ou seja, C'v = 0. Se o par (A, B) for controlável, C é não singular e essa condição 
se verifica somente se v = 0, implicando que We seja uma matriz definida positiva 
e, portanto, não singular. Em um sistema controlável, com condição inicial nula, 
sempre existe uma lei de controle que o leva até um estado final qualquer em um 
intervalo de tempo finito. 


Exemplo 5.3 No circuito da Figura 5.3, o amplificador operacional é considerado ideal. 
A tensão u é a entrada e a tensão y é a saída. Considerando como variáveis de estado as 
tensões vı e v2 nos capacitores, obtemos 


o aa —1/RıCı 0 1/RıCı P 
= | Rios E NRO 
o l Rə/Rı 1 jæ+[ —Rə2/Rı lu 
Com a realimentação de estado u = —[ky ko]x, a equação característica do sistema em malha 
fechada é 
l+ ki ko 
o E oae = 
RC RCo 
Como uma das raízes s = 0 é invariante com a escolha do ganho de realimentação de 


estado K e R!X2, concluímos que este sistema não é controlável. De fato, a matriz de 


o 
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controlabilidade 
EATE.. | 1 —1/RıCı | 
= RC —C1/C9 1/R4C5 


é singular e a matriz 


I — e7?7/R1C1 1 =O 
Np -C1/Cə C2/C2 
2RıCı 1/ 2 1/ 2 


também é singular para todo 7 > 0. Finalmente, a função de transferência entre a entrada 
û e a saída y pode ser calculada a partir da sua representação de estado 


RəC% = Rı Ci 1 Ro 
G(s) = DR mem | | 
RCC s + 1/RıCı Rı 
o Ro S + 1/R2C2 
E Rı S + 1/RıCı 
onde se nota que o polo em s = 0 foi cancelado pela ocorrência de um zero na mesma 
posição. Na verdade, essa função de transferência é de primeira e não de segunda ordem. 


Ao fazer a representação de estado de segunda ordem, sem levar em conta o cancelamento 
de um polo com um zero, obtivemos um par de matrizes (A, B) não controlável. c 


5.3 Regulador Linear Quadrático 


Não é fácil decidir onde alocar os polos de um determinado sistema dinâmico que 
se deseja controlar. O conjunto Q que é estabelecido pelos critérios de desempenho, 
define uma região no plano complexo C onde os polos do sistema em malha fechada 
devem se situar. Entretanto, os seguintes aspectos devem ser observados, quando se 
tenta alocar polos estáveis muito distantes do eixo imaginário, como forma de ter 
respostas cada vez mais rápidas: 


e À largura de faixa aumenta e, consequentemente, o sistema pode não atenuar 
de forma adequada ruídos sempre presentes na sua entrada. 


e Os ganhos de realimentação tornam-se elevados. 


e O controlador gera sinais de grandes amplitudes. 


Para conciliar um comportamento transitório adequado do sistema em malha 
fechada, mantendo o sinal de controle dentro de limites aceitáveis, define-se um 
critério de desempenho que permite calcular um ganho de realimentação de estado 
através da solução do seguinte problema de controle ótimo | 


min J(u) (5.45) 


| 
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sendo J(u) dado por 


Juya f (x(t) Qu(t) + pu(t)'u(t)) dt (5.46) 
onde z(t) € R” e u(t) € R satisfazem as equações de estado 
i(t) = Ax(t) + Bu(t), x(0) = zo (5.47) 


Este problema, bastante conhecido na literatura, é denominado Problema do Regu- 
lador Linear Quadrático. Sua solução fornece naturalmente um ganho ótimo de re- 
alimentação de estado K € R!*”, de tal forma que sua implementação se dá através 
de um controlador proporcional, isto é, u(t) = — Kw(t). O critério quadrático (5.46) 
depende da escolha de uma matriz simétrica Q € R"*” e de um escalar p. A matriz 
Q deve ser definida ou semidefinida positiva e o escalar p deve ser estritamente posi- 
tivo. O papel da matriz Q e do escalar p é definir o peso relativo que o estado e o 
sinal de controle têm no critério quadrático a ser minimizado. Como x(t)'Qa(t) > 0, 
para todo t > 0, esse termo penaliza as trajetórias em que o vetor de estado seja 
grande. Da mesma forma, como pu(t)'u(t) > 0, para todo t > 0 este termo penaliza 
as trajetórias em que o controle seja grande. Assim sendo, a escolha de Q > 0 e de 
p > 0 fazem com que um compromisso entre essas duas quantidades seja estabele- 
cido. Se Q > pl, o peso relativo do sinal de controle no cálculo do critério se reduz, 
em consequência, o sinal de controle pode atingir valores altos e o sistema responde 
fazendo com que o estado tenda a zero mais rapidamente. Em contrapartida, se 
Q «< pl, o peso relativo do sinal de controle no cálculo do critério aumenta, em 
consequência, o sinal de controle mantém-se em valores baixos e o sistema responde 
fazendo com que o estado tenda a zero mais lentamente. A solução do problema 
(5.45), dada no seguinte teorema, fornece o ganho ótimo de realimentação de estado. 


Teorema 5.2 A solução ótima do problema linear-quadrático (5.45) se expressa na 
forma u = —Kzx com K =p !B'P onde PE R"*" é a solução simétrica e definida 
positiva da equação matricial de Riccati 


AP+PA-p!PBBP+Q=0 (5.48) 
Ademais, o valor mínimo do critério é dado por Jmin = ztọP £0. 


Prova: A prova decorre da definição da função de Lyapunov v(x) = x'Px, com 
P > O calculada a partir da equação de Riccati. Derivando-a em relação ao tempo 
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e usando (5.48), obtemos 


o(a) 


x (A'P +PAjx+uB'Pr+a'PBu 
= «(po !PBB'P-Qx+u'B'Pr+x'PBu 
= —g'Qg — pu'u + plu + p`! B'Pzxy (u + p`! B'Pr) (5.49) 


cuja integral de O a +00 fornece 
J(u) =v((0)) = v(e(o0) +p | (u+0™B'Pa) (u+ p B'Pajdt (5.50) 
0 


Como v(x) = O se e apenas se x = 0 e queremos que a lei de controle garanta a 
estabilidade do sistema em malha fechada, devemos impor v(x(00)) = 0. Portanto, 
a equação anterior permite determinar 


J(u) = v(xo) + of tu +90 1B'Po)(u+p !B'Pex) dt 
> v(Zo) (5.51) 


que é válida para todo controle que estabiliza o sistema em malha fechada. Em 
conclusão, fazendo u = —Kz com K = p !B'P, a integral não negativa que aparece 
no lado direito de (5.51) se anula e o critério quadrático é minimizado. Para este 
controle, a igualdade se verifica e Jmin = v(xo) = v9Pzo. o 


O Teorema 5.2 requer que exista um ganho K de tal forma que A — BK seja 
estável para assegurar que o valor mínimo Jmin do critério quadrático seja finito. 
Uma forma de impor a existência de um ganho estabilizante é o par (A, B) ser 
controlável. De forma similar, alguma hipótese deve ser feita a respeito da escolha 
da matriz Q. Ser apenas semidefinida positiva faz com que, no caso extremo Q = 0, 
o critério J(u) não dependa da variável de estado criando um problema singular sem 
interesse. A escolha Q > 0 faz com que o critério dependa de todas as variáveis de 
estado. Com o par (4, B) controlável a determinação da solução positiva definida da 
equação de Riccati (5.48) elimina qualquer singularidade. Finalmente, é importante 
observar que o ganho ótimo não depende da condição inicial xo € R” fazendo com 
que, uma vez implementado, o sistema em malha fechada opere da melhor maneira 
possível para qualquer condição inicial que venha a ocorrer. 

O problema que acabamos de resolver admite uma outra interpretação, que nos 
será útil em seguida. Com um controle de realimentação de estado u = —Kx em 
(5.47) a sua solução fornece 


r(t) = e ABR (5.52) 
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válida para todo t > O. Com essa solução, supostamente estável, obtemos 


Il 


J(K) m r(t) (Q + pK'K)z(t)dt 


= / pe BE O po je Cd 
0 


= toPxo (5.53) 


sendo que a matriz simétrica e definida positiva P € R”*” é dada por 
OO 
pe / SA-BEYUO + pK'K)elA- Bda (5.54) 
i | 


ou equivalentemente, como vimos no Capítulo 3, solução da equação de Lyapunov 
(A— BKP +P(A- BK)+Q+pK'K=0 (5.55) 


O Teorema 5.2 coloca em evidência que o ganho de realimentação de estado que 
minimiza J(K) é obtido através da relação K = p !B'P com a qual, substituída na 
equação de Lyapunov (5.55), obtemos a equação de Riccati (5.48). É preciso colocar 
em evidência um aspecto numérico importante. Enquanto a equação de Lyapunov 
é linear e envolve a determinação de n(n + 1)/2 elementos da matriz simétrica P, 
a equação de Riccati tem o mesmo número de variáveis mas é não linear. Por este 
motivo, a equação de Riccati é muito mais difícil de ser resolvida do que a equação 
de Lyapunov, requerendo o auxílio de rotinas numéricas. | 

Entretanto, para um caso particular mas de grande interesse, existe uma maneira 
de resolver o problema linear quadrático sem ter que resolver a equação de Riccati. 
Assumimos que a matriz Q > 0 pode ser fatorada na forma Q = V'V com V € 
RX”, Neste caso, definindo uma saída fictícia para o sistema (5.47) como sendo 
z(t) = Vx(t), o critério quadrático fica 


OO 
ie f can lt) dt (5.56) 
0 
e a sua minimização pondera simplesmente os desvios em relação a zero da saída 


escolhida e do controle, sem dar importância às demais variáveis de estado. 


Teorema 5.3 Seja p(s) = V(sI — AJ !B. Os polos do sistema em malha fechada 
r(t) = (A-BK)x(t), onde K é o ganho ótimo solução do problema linear quadrático, 
são as n raízes da equação algébrica de grau 2n 

L+p“a(=s)o(s) =0 (5.57) 


situadas no semiplano esquerdo complexo. 
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Prova : Inicialmente definimos a matriz 


A -pot B p 2nx2n 
= R 5.58 
4 | V'V A | E do 
sendo P € R"*" a solução definida positiva da equação de Riccati (5.48), simples 
manipulações algébricas permitem verificar que 


I f fd 
zip|-|p|(4-s BB P) (5.59) 
onde, no lado direito de (5.59), notamos a matriz A — BK sendo K = pero 
ganho ótimo. Considerando (A, v) um par qualquer de autovalor e de autovetor dessa 
matriz, multiplicando (5.59) à direita por v obtemos Z9 = Ad onde ð = |I Ro: 
Ou seja, os autovalores da matriz de malha fechada (A — o *BB'P) também são 
autovalores de Z. Portanto, devemos determinar o seu polinômio característico 


— “Ds 
det(s! — Z) = det | PE o | 


VV sI+A (500) 


o qual pode ser calculado aplicando-se propriedades elementares de determinantes 
introduzidas no Capítulo 3, ou seja 


det(sI — Z) 


Il 


det(s1 + A')det((s1 = A) =p BB'(sI + AyAVIV) 
= det(sI + Adet(s] — A) x 
xdet (1 sa Dp IgA Vel = A) 
= (—1)det(—sI — Adet(sI — A) x 
i (1 + 9! B (=s sA) VYGIS AB) (5.61) 


e, finalmente, lembrando que podemos fatorar p(s) = V(sI — AJ IB = N(s)/D(s) 
com D(s) = det(s] — A), a equação (5.61) assume a forma final 


REGRA DE (D(=s)D(s) de pI N(=s)N(s)) (5.62) 


Como a equação característica de Z admite 2n raízes, como a equação (5.62) implica 
que se s € C for uma de suas raízes então —s € C também será, como as n raízes da 
equação característica do sistema em malha fechada também são raízes da equação 
característica de Z e como o sistema em malha fechada é assintoticamente estável, 
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Figura 5.4: Lugar as raízes simétrico 


concluímos que as n raízes da equação característica do sistema em malha fechada 
são as n raízes da equação característica de Z que se localizam no semiplano esquerdo 
do plano complexo. A prova está concluída pois igualando-se (5.62) a zero obtemos 
a equação (5.57). O 


Com o resultado deste teorema, podemos usar o lugar das raízes para escolher 
o valor de p > O de tal forma a expressar um bom compromisso entre os custos 
de controle e de saída. Como (s) é uma função conhecida, podemos traçar o 
lugar das raízes de (5.57) em função de p7! > 0. Ele terá 2n ramos mas apenas 
n deles estarão no semiplano esquerdo complexo. Selecionamos um valor de p > 0 
e, em seguida, resolvemos a equação de Riccati para determinar o ganho ótimo 
K = p!B'P. De forma alternativa, ao escolher p > 0, determinamos os n polos 
estáveis correspondentes ao sistema em malha fechada e determinamos diretamente 
o ganho K para alocar esses polos nas referidas posições. Neste último caso, evita- 
se a resolução da equação de Riccati. Finalmente, cabe alertar que nem sempre 
podemos aplicar as regras fornecidas anteriormente para o traçado do lugar das 
raízes simétrico. Isto ocorre quando os coeficientes dos termos de maior grau do 
numerador e do denominador do produto y(— s)y(s) não tiverem o mesmo sinal. 
Essa eventualidade requer o uso de uma rotina numérica. 


A prova do Teorema 5.3 deixa claro que mesmo se a matriz Q não puder ser 
fatorada na forma Q = V'V com V e€ R!X” sendo uma matriz com apenas uma linha 
mas com diversas colunas, o seu resultado se mantém desde que (5.57) seja alterada 
para 1 + ply(—s)'o(s) = 0. Muito embora a função y(s) agora seja vetorial, o 
produto (—s)'p(s) continua sendo uma função escalar que pode ser calculada sem 
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Figura 5.5: Lugar as raízes simétrico 


dificuldades. Esse aspecto será ilustrado através do próximo exemplo. 


Exemplo 5.4 Novamente, consideramos o motor de corrente contínua cuja representação 
de estado é dada no Exemplo 5.1. Com Q = J, determinamos os autovalores da matriz 
ee A =p" BB c R$*4 
SO “A 

em função de p pertencente ao intervalo 1 < p < 25. A Figura 5.4 mostra as trajetórias 
desses quatro autovalores. Nota-se sua simetria em relação ao eixo imaginário, sendo que 
dois autovalores sempre se encontram no semiplano esquerdo complexo. Esses são os polos 
do sistema em malha fechada 4 = (A — p"!BB'P)z obtidos pela solução do problema linear 
quadrático para cada p pertencente ao intervalo considerado. 

Para p = 25 a solução da equação de Riccati fornece a solução simétrica definida positiva 


| 3,4271 2,5726 


P= | 35726 27289 


>0 


a qual permite determinar o ganho ótimo de realimentação de estado K = [0,1029 0,1092] 
que posiciona os polos do sistema em malha fechada em {—0,2699; —0,9106+. Como anterior- 
mente, não há dificuldades para se determinar a matriz M = [15,7423 16,6982], responsável 
por assegurar erro nulo em regime permanente para a entrada degrau. O 


Exemplo 5.5 Para o motor de corrente contínua cuja representação de estado é dada no 
Exemplo 5.1, consideramos Q = V'V com V = [1 0], o que significa ponderar no critério 
quadrático apenas a saída z(t) = Va(t) = xı(t) correspondente à primeira variável de 
estado que é a velocidade angular da carga. Com o Teorema 5.3 determinamos a função de 
transferência 


1 
pls) = 271 07ids 101429 
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e o lugar das raízes simétrico em relação a p7! > 0 da equação característica do sistema em 
malha fechada 1 + p-!o(—s)p(s) = 0, mostrado na Figura 5.5. O valor de p = 6 faz com 
que os dois polos situados no semiplano esquerdo coincidam em s =» —0,63 que é a condição 
para que a resposta do sistema em malha fechada seja a mais rápida possível sem que ocorra 
oscilação. Através da solução do problema linear quadrático, o sistema em malha fechada 
tem excelente desempenho com um baixo esforço de controle. E 


5.4 Observador de Estado 


Como vimos, a grande vantagem do projeto de controladores via realimentação 
de estado reside na possibilidade de alocarmos todos os polos do sistema em malha 
fechada em posições convenientes no plano complexo. Apenas com duas matrizes de 
ganho (K, M), podemos impor ao sistema em malha fechada qualquer desempenho 
desejado, porém, a implementação dessa lei de controle requer que todos os elementos 
do vetor de estado sejam medidos e realimentados. Entretanto, nem sempre temos 
condições de medir todos os estados de um sistema, seja por motivos de custo dos 
sensores ou por impossibilidade física de implantação, na planta, dos medidores 
necessários. Assim sendo, uma forma de contornar essa dificuldade é estimar os 
estados, tendo como base as informações disponíveis em tempo real nas suas saídas 
mensuráveis e, de posse da estimativa, utilizá-la no lugar do estado verdadeiro para 
implementar a lei de controle. 

O observador de estado é a estrutura que permite estimar o estado de um sistema 
dinâmico, a partir dos seus sinais de entrada e de saída. Para sintetizá-lo, é necessário 
conhecermos com boa precisão o seu modelo, a fim de que as estimativas dos estados 
sejam as mais fiéis possíveis aos valores reais. Como o estado não é conhecido, 
as condições iniciais do sistema físico e as do estimador são, em geral, diferentes. 
Portanto, devemos assegurar que o estado estimado convirja para o estado verdadeiro 
o mais rápido possível, levando em conta certas limitações que serão explicitadas 
mais adiante. 

A Figura 5.6 mostra o diagrama de blocos de um observador. A ideia central 
é bastante simples. O bloco denominado observador contém uma cópia exata do 
modelo interno da planta. O sinal de controle, que é injetado simultaneamente na 
planta e no observador, produz um sinal de erro o qual, multiplicado por uma matriz 
de ganho L € R”*!, corrige a saída do observador de tal forma que o seu estado 
to(t) € R” tenda para o estado da planta x(t) € R”, no decorrer do tempo. Nota-se 
que o observador depende do modelo interno da planta, o qual deve ser perfeitamente 
conhecido. | 
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Figura 5.6: Observador de estado 


Assim sendo, para uma planta descrita pelas equações de estado (5.8)-(5.9), aqui 
novamente repetidas 


| 


Tt Ax + Bu (5.63) 


y = Cr+ Du (5.64) 


em conformidade com o diagrama de blocos da Figura 5.6, as equações de estado do 
observador são dadas por 


to = Áz+ Bu+ L(y -— yo) (5.65) 
Yo = Cr,+4 Du (5.66) 
sendo possível notar que a comparação entre a saída estimada volt) e a saída real 
y(t) é fundamental para assegurarmos que o estado estimado xo(t) se aproxime do 
ao z(t), através de uma escolha conveniente e adequada da matriz de ganho 
a l 
L € R””?. Definindo o erro entre o estado verdadeiro e o estado estimado como 
sendo eo(t) = x(t) — xo(t), temos 
Co =S= wia 
Ax + Bu — (Aro + Bu + LCzx — LC zo) 
A(z — £o) — LC (x — zo) 
= (A-— LC)eo (5.67) 
Essa equação mostra que o vetor de erro obedece a uma equação diferencial 
que pode se tornar estável, segundo uma escolha adequada da matriz de ganho 
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L. Portanto, o primeiro critério a ser considerado é que L deve tornar a matriz 
A- LC estável fazendo com que lim;-soo Colt) = 0 para toda condição inicial eo(0) = 
r(0) — xo(0). Por outro lado, é imperativo que col(t) tenda para zero com uma 
velocidade aceitável para que xo(t) = x(t) no menor intervalo de tempo possível. 
Ou seja, devemos alocar os polos da dinâmica do erro de observação (5.67), que são 
os autovalores da matriz A — LC, de forma que eles sejam estáveis e se situem à 
esquerda dos polos do sistema original. 

Entretanto, analogamente ao que ocorre na realimentação de estado, alocar os 
polos de A — LC muito à esquerda no semiplano esquerdo complexo, exige que as 
componentes do ganho do observador L sejam grandes. O erro de estimação tende a 
zero rapidamente mas, por outro lado, a largura de faixa do observador também será 
grande e, assim, o ruído de medida sempre presente na saída do sistema y(t) afetará 
negativamente o seu desempenho. Assim sendo, é imperativo obter-se uma solução 
de compromisso para o ganho de observação L € R"ºX1 o que é conseguido através 
de um estudo mais detalhado de como os eventuais ruídos atuam em sistemas de 
controle. 

Neste sentido, os ruídos que atuam em um sistema de controle são descritos pelas 
variáveis w(t) e v(t). A primeira é um vetor de n componentes e corresponde ao 
ruído aditivo presente nas variáveis de estado. A segunda é um escalar e indica o 
ruído introduzido pelo medidor da saída y(t). A representação de estado do sistema 
em malha aberta torna-se 


t = Ar+Bu+w | (5.68) 
y = Cr+Du+v (5.69) 


e o erro de observação também se modifica para 
to = (A — LC)eo + w — Lv (5.70) 


com a qual concluímos que, de fato, o aumento do ganho do observador faz com que 
a dinâmica do erro possa ser mais rápida mas, em contra partida, a intensidade do 
ruído aditivo que interfere no erro de observaçao aumenta, deixando claro que um 
compromisso de projeto deve ser estabelecido. 

Cabe ressaltar que a equação (5.70) pode ser resolvida sem dificuldades. Sob 
condições inicias nulas, para explicitar o comportamento do erro de estimaçao devido 
apenas à presença dos ruídos, sua solução permite determinar 


et) = J ' KALOG) (w(r) — Lu(7)) dr (5.71) 
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A seguir, vamos dar duas visões possíveis de como tratar os ruídos w(t) e v(t), a 
saber, uma determinística e outra estocástica. No primeiro caso, eles são dados por 


w(t) = US), v(t) = VE Slt) (5.72) 


onde U € R”*1 define as componentes do vetor de estado que estão sujeitas ao ruído 
w(t), por exemplo, se o ruído com intensidade a for introduzido apenas pela ação 
do atuador no canal de controle então U = yaB e /u define a intensidade do ruído 
introduzido pelo sensor no canal de saída. Por outro lado, a presença da função 
impulso nos dois sinais reside no fato de que ô (jw) = 1 introduz uma perturbação 
“branca”, isto é, unitária e constante em todo o espectro de frequências. 

Substituindo-se (5.72) em (5.71) determinamos os erros eylt) e eult) produzidos 
pelos ruídos w(t) e v(t) aplicados separadamente, ou seja 


eni me ee ye A aL (5.73) 


de tal forma que um bom critério de desempenho para a escolha do ganho do obser- 
vador L pode ser escrito na forma 


je J aare aa (5.74) 


Trata-se de um critério quadrático que, ao ser minimizado em relação ao ganho do 
observador L € R”X!, faz com que o erro de estimação devido à ação conjunta dos 
dois ruídos w(t) e v(t) seja reduzido. Substituindo (5.73) em (5.74) e usando uma 
propriedade da função traço de matriz estudada no Capítulo 3, obtemos 


Il 


JL) / Cu a TA åA H 


0 


OO 
Tr T C COCO OR LIA at) (5.75) 
0 


que é uma função muito parecida com aquela do problema linear quadrático (5.53). 
O próximo teorema mostra que a solução ótima do problema 


min J(L) (5.76) 
pode ser calculada através da solução de uma equação de Riccati bastante simi- 
lar àquela introduzida no Teorema 5.2, que resolve o problema linear quadrático 
associado à determinação do ganho ótimo de realimentação de estado. 
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Teorema 5.4 A solução ótima do problema (5.76) é dada por L = ui RC", onde 
R € R”*” é a solução simétrica e definida positiva da equação matricial de Riccati 


ARS RA = "ROCRA UU =0 (5.77) 
Ademais, o valor mínimo do critério é Jmin = Tr(R). 


Prova : Lembrando que o traço de uma matriz é igual à soma dos elementos da sua 
diagonal principal, denotando por d; E€ R” para i = 1,::-,n as colunas da matriz 
identidade de dimensão n x n, o valor do critério J(L) se escreve alternativamente 


n só 
JL) = 5 d; ( | EAU bE e AA a) d; 

i=1 0 

n 

ql 

onde e 
R= | gann UU SO TODO e EON (5.79) 
O 


Comparando essa expressão com (5.54), notamos que ambas são idênticas desde 
que as matrizes (A, B, Q, K) sejam substituídas pelas matrizes (A', C”, UU’, L’) eo 
escalar p > O seja substituído pelo escalar u > 0. Assim sendo, impondo-se a relação 
adicional L’ = y *CR na equação de Lyapunov 


(A-LOR+ R(A — LOY +UU' + uLI' =0 (5.80) 


obtemos a equação de Riccati (5.77) e o ganho ótimo que minimiza cada parcela 
da soma indicada em (5.78) uma vez que ele não depende dos vetores d; € R” para 
todo 1 = 1,---,n. Finalmente, a relação (5.78) fornece o valor mínimo do critério 
Jmin = Dm d; Rd; = Tr( R), o que prova o teorema proposto. o 


É claro que precisamos ter certeza que, ao adotarmos a solução preconizada pelo 
Teorema 5.4, a equação que rege o comportamento dinâmico do erro de observação 
(5.70) seja assintoticamente estável. A existência de uma matriz L de tal forma que 
A— LC tenha essa propriedade é assegurada desde que o par (A', C”) seja controlável, 
isto é, se o par (A, C) for observável, um conceito a ser melhor estudado em seguida. 
A existência de R > 0 solução da equação de Riccati garante que o problema de 
síntese de um observador ótimo está livre de qualquer singularidade. 
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Teorema 5.5 Seja y(s) = C(sI— AJTIU. Os polos da equação que rege a dinâmica 
do erro de observação es(t) = (A— LC)eo(t), onde L é o ganho ótimo do observador, 
são as n raízes da equação algébrica de grau 2n 


1+ ur tp(-s)p(s) =0 (5.81) 
situadas no semiplano esquerdo complexo. 


Prova : Procedendo exatamente como na prova do Teorema 5.3, definimos a matriz 


as A! EU 
| —UU' — À 


| ER (5.82) 


e verificamos que os autovalores de A — yu !RC'C são também autovalores de Z. 
Finalmente, fatorando (s) = C(sI— A)™tU = N(s)/D(s) com D(s) = det(sI— 4), 
obtemos 


det(s] — 2) = (=1)º (D(=s)D(s) E po N(-s)N(s)) (5.83) 


a qual, igual a zero, fornece a equação (5.81). o 


Como anteriormente, os n ramos do lugar das raízes da equação (5.81) localizados 
no interior do semiplano esquerdo complexo é que são os de nosso interesse. Eles 
indicam os polos do observador ótimo segundo a variação da intensidade Vu do ruído 
de medida v(t). Alterar u > 0 significa mudar as características do sensor utilizado 
para se efetuar a medida da saída do sistema y(t), no decorrer do tempo. Um valor 
menor de u > 0 indica a necessidade de se ter um sensor de melhor qualidade. Em 
contra-partida o observador fica mais rápido e, assim, em um curto intervalo de 
tempo, o seu estado xo(t) torna-se bem próximo do estado z(t) do sistema dinâmico 
em estudo. 

Passamos agora a estudar o segundo caso. Nele, os ruídos w(t) € R” e v(t) ER 
são ruídos brancos gaussianos. Denotando E{-} o operador esperança matemática, 


o AON ao, san 


o que indica que ambos têm médias nulas e 


ole e e-a wr 5.85) 
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com matriz de covariância que depende apenas de t — 7, indicando que se trata de 
um processo estocástico estacionário. Observe que o zero fora da diagonal da matriz 
no lado direito de (5.85) indica que os ruídos w(t) e v(t) não são correlacionados. 
Aplicando o operador esperança matemática em ambos os membros de (5.71), vem 


Cent E JE p e AAL (ay(7) LT dr) 
= / “EMA -LOJt- (ELw(T)) — LE{v(T)}) dr 


O 
= 0 | (5.86) 


o que indica que o valor médio da saída do observador para todo t > O é nula, como 
consequência da condição inicial eo(0) = 0 e dos valores médios nulos dos ruídos. 
Observe que a última igualdade decorre do fato de que as médias dos ruídos são 
nulas. Por outro lado, a partir da solução (5.71), podemos determinar a variância 
do erro do observador 


| t t f 
E / / ALOE P(r, EJel4-LOV 0- dr dê (5.87) 
, O JO 


onde T(r, E) = El(w(r)—-Lu(r))(w(€)— Lu(é))' + é uma função que pode ser calculada 
sem dificuldades a partir da matriz de covariância dos ruídos dada em (5.85). De 
fato, expandindo o operador esperança matemática, vem 


F(T, £) E{w(rjwlE) } + E{LolrjolEy LS 
(UU! FuLL JEE — 7) (5.88) 


cujo valor levado em (5.87) fornece 


t 
Clete] = | e(A-LC) (t8) (UU E TA ed) dé 
O 


t 
= | gae O h e a y (5.89) 
O 


onde a segunda igualdade decorre da mudança de variável r = t — é. Neste ponto, 
cabe ressaltar que, tendo calculado o ganho do observador de tal forma que A — LC 
seja uma matriz assintoticamente estável, a equação acima permite determinar 


lim E{eo(t)eo(t)'} = / e OU nb Cdr 
29 O 
R (5.90) 


Il 
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que é exatamente a matriz dada em (5.79) que tínhamos obtido no contexto de- 
terminístico. Finalmente, usando uma vez mais as propriedades da função traço, 
vem 


lim E{eo(t)'eo(t)} = lim E(Tr(eo(t)eo(t))) 


= “lr (tim E{eo(t)eolt)}) 
= IN) 
é di (5.91) 


onde a última igualdade decorre de (5.75). Ou seja, acabamos de mostrar que, ao 
calcularmos o ganho ótimo do observador através da solução do problema (5.76), es- 
tamos minimizando o erro médio quadrático em regime permanente € [eo(00)'eo(00) 
por ele produzido. Por outro lado, como essa quantidade tende a um valor constante 
e finito quando t — oo, da mesma forma temos 


lim Le l / e at) JO (5.92) 


fazendo com que a minimização de J(L) também minimize a média temporal do 
erro médio quadrático. Com base nestes resultados, podemos afirmar que a deter- 
minação do ganho do observador através da solução do problema (5.76), ou de forma 
equivalente, através da aplicação do Teorema 5.4, é bastante efetiva para obter um 
compromisso adequado entre a velocidade de redução do erro do observador, em 
relação ao tempo, e a sua largura de faixa. 


Exemplo 5.6 Consideramos novamente o modelo do motor de corrente contínua apre- 
sentado no Capítulo 2. Porém, o motor deve mover a mesma carga a qual, agora, está 
engastada em um ponto fixo através de um eixo flexível com constante elástica x. Assim 
sendo, o modelo é composto pela equação de corrente 


e pela equação do deslocamento angular da carga 


d0 d8 
(Je + ma +b + n0 =cKi 


Definindo o vetor de variáveis de estado x = [i 0 0]! € Ré, com os valores numéricos adotados 
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Figura 5.7: Simulação sem os ruídos 


anteriormente e K = 2 [Nm/rad], obtemos a sua representação de estado na forma 


—1,0000 O —1,0000 1 

E 0 O 1,0000 [2x+| 0 |u 
0,0714 —0,1429 —0,0714 0 

y = [00 Lila 


sendo que a saída y fornece a velocidade angular da carga. Como o sistema em malha 
aberta é estável e o seu polo mais rápido é —0,9294, projetamos um observador com todos 
os autovalores de 4 — LC iguais a —2, fazendo com que a sua resposta seja um pouco mais 
rápida que a resposta do sistema. Isto é conseguido com o ganho | 


—15,0000 
L= | —55,0000 
4,9286 


Para comparação, consideramos os sinais de controle u(t) e de saída y(t) submetidos a ruídos 
aditivos brancos de tal forma que U = 10"!B e VU = 1072, Isto corresponde a implementar 
o controle com erro de 10% e medir a saída com erro de 1%, para sinais unitários. Neste 
caso, aplicando o Teorema 5.4, determinamos o ganho ótimo a partir da solução da equação 
de Riccati (5.77) 
1,7587 
Lric= | 0,0000 
0,4349 


e os autovalores da matriz A — LricC que são dados por {—0,6087 + j0,3521; —0,2889}. Note 
que os polos do observador ótimo não são mais rápidos que os polos do sistema em malha 
aberta e que existe uma diferença significativa entre L e Lic, como consequência de termos 
levado em conta os ruídos aditivos nos sinais de controle e de saída. 
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Figura 5.8: Simulação com os ruídos 


A Figura 5.7 mostra em linhas contínuas as trajetórias do deslocamento angular, em 
graus, da carga 0(t) e em linhas tracejadas as estimações produzidas por dois observadores, 
um deles com o ganho L e o outro com o ganho Lrie A simulação foi feita a partir da 
condição inicial «(0) = [1 7/3 O, com a entrada u(t) = 7/3 para todo t > 0 e sem a 
introdução de ruídos. Inicialmente o rotor estava na posição 0(0) = 7/3 e o controle foi 
determinado para fazê-lo retroceder para a posição 9(00) = n/6. Note que a função de 
transferência do motor tem um ganho DC igual a 1/2. Observe que i(0) Æ 0 como forma 
de tornar mais difícil a estimação do vetor de estado. Cada observador parte com condição 
inicial nula e, após um breve período de tempo, a posição angular da carga é perfeitamente 
estimada. Como era de se esperar, o primeiro observador é mais rápido que o segundo para 
atingir o valor verdadeiro a ser estimado. 

A Figura 5.8 foi feita de maneira idêntica, a não ser pelo fato de que ruídos brancos 
foram adicionados no sinal de controle, com média nula e variância 1072 e no sinal de 
saída, com média nula e variância 1074. Nota-se que a estimação produzida pelo primeiro 
observador tornou-se inviável com a presença dos ruídos enquanto que o segundo estimador é 
praticamente insensível a eles. Um bom compromisso entre rapidez e precisão foi conseguido 
com o segundo observador. o 


Embora tenhamos feito todos os cálculos com a matriz U € R”X! composta por 
apenas uma coluna, eles podem ser generalizados para contemplar o caso em que U 
seja uma matriz qualquer, com dimensões compatíveis. Nesta situação, O resultado 
do Teorema 5.4 permanece inalterado e a equação (5.81) deve ser modificada para 
1 + ulhb(-s)yp(s) = 0. Como já foi comentado anteriormente, muito embora a 
função W)(s) deixe de ser escalar, isso não causa grandes dificuldades pois o produto 
W(—s)xb(s)' permanece sendo uma função escalar. A importância dessa generalização 
reside no fato dela permitir o tratamento de ruídos mais ricos, que atuam nas diversas 
variáveis de estado de forma independente. Como já foi comentado, cabe alertar que 
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nem sempre podemos aplicar as regras fornecidas anteriormente para o traçado do 
lugar das raízes simétrico. Isto ocorre quando os coeficientes dos termos de maior 
grau do numerador e do denominador do produto )(—s):)(s) não tiverem o mesmo 
sinal. Essa eventualidade requer o uso de uma rotina numérica. 


5.4.1 Observabilidade 


O conceito de observabilidade de um sistema dinâmico está ligado, de maneira 
indissolúvel, ao fato de sua saída conter informação suficiente para que o seu estado 
possa ser, a partir dela, totalmente reconstruído. Assim sendo, a observabilidade é 
uma propriedade central para que o projeto de um observador de estado possa ser 
realizado com sucesso. A definição formal de observabilidade pode ser colocada nos 
seguintes termos. | 


Definição 5.2 (Observabilidade) O sistema dinâmico t = Ax, y = Cx é dito 
observável se o conhecimento de y(t), para todo O < t < T com T > 0 arbitrário, 
permitir determinar unicamente v(0) € R”. Por simplicidade, diremos que o par 


(A,C) é observável. 


É preciso ficar claro que a especificação do estado inicial não acarreta nenhuma 
perda de generalidade na Definição 5.2. Como se trata de um sistema invariante no 
tempo, o mesmo é válido para a determinação de x(£) a partir do conhecimento de 
y(t) para todo € < t < E + 7, com é > O arbitrário. O lema a seguir estabelece um 
teste simples para verificar se um par de matrizes (4, C) é observável. 


Lema 5.2 O par (A,C) é observável se e somente se a matriz 


C 


CA 
Qa Ek (5.93) 


C An- 
denominada matriz de observabilidade, for não singular. 


Prova : Como sabemos que a solução única de t = Ax com a condição inicial 
z(0) = O fornece a saída y(t) = O para todo t > 0, para que este sistema seja 
observável é preciso que y(t) = Cettx(0) = 0 para todo 0 < t < T com T > 0 
arbitrário, implique que a única condição inicial possível seja x(0) = 0. De fato, como 
y(t) é uma função nula em um intervalo de tempo finito, as suas derivadas sucessivas 
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até qualquer ordem em t = 0 também são nulas, ou seja C A"z(0) = 0, Yk E N. A 
prova consiste em determinar sob quais condições esse sistema linear com infinitas 
restrições admite x(0) = O como solução única. Com o resultado do teorema de 
Cayley-Hamilton (5.1) sabemos que AF pode ser escrita com combinação linear de 


AS. At,  A?-1 para todo k > n indicando que o sistema de equações em estudo 
é equivalente a CAtx(0) = 0 para todo k = 0,::: ,n — 1, ou seja, ele é equivalente 
a Ox(0) = 0. A matriz O não singular é uma condição necessária e suficiente para 
que x(0) = O seja solução única, o que prova o lema proposto. O 


Comparando o resultado do Lema 5.1 com o do Lema 5.2 notamos imediata- 
mente que existe uma relação precisa entre controlabilidade e observabilidade. A 
observabilidade do par (A, C) é equivalente à controlabilidade do par ( A’, C”), en- 
quanto que a controlabilidade do par (A, B) é equivalente à observabilidade do par 
(A', B'). Por este motivo, esses conceitos são conhecidos como conceitos duais. 

Uma outra consequência importante de um par (A, C) observável ser equivalente 
ao par (A', C") controlável é que, a partir da Definição 5.1 existe uma matriz L’ que 
aloca todos os polos de A’ — C'L' em posições previamente estabelecidas. Porém 
como 4'-C'L! = (A-LC')' e como os autovalores de uma matriz e de sua transposta 
são idênticos, a observabilidade do par (A, C) assegura a existência de um ganho L 
que posiciona todos os polos de A — LC arbitrariamente. Ou, em outras palavras, 
a observabilidade assegura que é possível projetar um observador com qualquer 
desempenho previamente estabelecido. 

A partir da observabilidade do sistema t = Az, o conhecimento de y(t) = Ca(t) 
para todo 0 < t < T com T >Ù permite calcular a sua condição inicial z(0) = vo da 
seguinte forma 


En / e^'tC'y(t) dt (5.94) 
O 


onde 


W, = / efto Ce% dt e RP” (5.95) 
O 


é uma matriz simétrica que deve ser não singular. Considerando zo € R” um vetor 
não nulo, temos 


> 
/ 
toWoLo = | re’ Ceao dt 
0 


|l 


/ ETORTOL: 
0 


sü 


(5.96) 
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ficando aparente que a igualdade em (5.96) só pode ocorrer com zo Æ 0 se e apenas 
se y(t) = 0 para todo O < t < T, o que é impossível se o par (A, C) for observável. 
Portanto, um teste alternativo para a observabilidade é a verificação de que a matriz 
simétrica W, seja positiva definida. 


Exemplo 5.7 O modelo do motor de corrente contínua usado para mover uma carga, 
considerado no Exemplo 5.6 é observável. De fato, as matrizes 


-R/L 0 —cK/L 
A= 0 0 Fise i L] 
cK/J rf] —b/J 


permitem calcular O e RX, bem como o seu determinante 


woss (7) (5) 


que é diferente de zero assegurando assim a observabilidade do par (A, C). Porém, é inte- 
ressante notar que se a carga se desligar do engaste, k = O faz com que o sistema torne-se 
não observável. Em consequência, não é mais possível projetar um observador de estado 
adequado medindo-se apenas a velocidade angular da carga. o 


5.5 Projeto de Servomecanismos 


O chamado projeto de servomecanismos é o projeto mais geral e abrangente que 
pode ser feito no âmbito de sistemas de controle. A sua estrutura básica, dada 
na Figura 5.9, mostra a função de transferência em malha aberta G(s) com a sua 
representação de estado definida pelas matrizes (A, B,C, D). Essa estrutura básica 
de controle depende de três ganhos K € RI" M e R”*! e L e R”"*! que devem 
ser determinados para que os critérios de desempenho do projeto sejam atendidos. 

Pela Figura 5.9, notamos que os ganhos M e K são os mesmos que foram con- 
siderados quando estudamos a realimentação de estado. Porém, agora, ocorre uma 
diferença significativa, pois apenas a saída y (e não o estado %) é medida e, con- 


sequentemente, fica disponível para realimentação. Assim sendo, a partir da saída, 
-= projeta-se um observador com ganho L para gerar uma estimativa ĉo que é reali- 
mentada no lugar do estado verdadeiro 2. Um fato até certo ponto surpreendente 
que ocorre com esta estrutura de controle é que os ganhos (M, K) e L podem ser 
determinados separadamente, de forma que com os dois primeiros procuramos aten- 
der os critérios de desempenho como se o estado estivesse disponível (realimentação 
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o a SE ad E Sa cd a E CORRE LTS gi TN ia ri, Cru siri o oi, Di o veem it 


Observador - L | J 


Figura 5.9: Estrutura básica de controle 


de estado) e com o segundo procuramos forçar que o erro entre o € X seja o menor 
possível (observador). Assim sendo, as equações que descrevem o comportamento 
desta estrutura de controle são as que definem a representação de estado da função 
de transferência G(s) da planta 


t = Ar+ Bu (5.97) 
= Cr+ Du (5.98) 


em seguida, as que definem a representação de estado do observador 


io = Axo + Bu+ L(y — yo) (5.99) 
Yo = Czo + Du (5.100) 


e, finalmente, a lei de controle 
u = K(Mr — zo) (5.101) 


a qual é responsável pelo fechamento da malha através da introdução do sinal de re- 
ferência. Observe que a lei de controle (5.101) é idêntica à lei de controle (5.21) após 
a substituição do estado estimado x, pelo estado verdadeiro x e que, neste primeiro 
momento, não estamos considerando a presença de ruídos externos. Substituindo 
(5.101) nas equações de estado da planta, obtemos 


t = (A-BK)x+ BKe + BKMr (5.102) 
= (C-—-DK)v+ DKe + DKMr (5.103) 
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onde e, = x — To é o erro de observação o qual, com as equações do observador, é 
dado por 


ĉo = (A — LC)e (5.104) 
Portanto, a partir dessas equações e do vetor de estado aumentado 
PE T o T£ 2n 
sim E Jelen E8 (51105) 


a representação de estado do sistema em malha fechada pode ser escrita na forma 


do tum [DIE BE BKM 
a 0 A- LC | Va 0 ih (5.106) 
y = [C-DK DK |ra+DKMr (5.107) 


a qual permite duas conclusões importantes a respeito do projeto em estudo. A 
primeira delas diz respeito a sua equação característica de grau 2n dada por 


det {sT — (A - BK) )det(sI—(A— LC)) = 0 (5.108) 


ou seja, os seus polos são aqueles alocados através da escolha do ganho de controle 
K come se o estado estivesse disponível para realimentação e, aqueles alocados 
através da escolha do ganho do observador L. A segunda decorre da determinação 


da função de transferência obtida pela simples aplicação da transformada de Laplace 
em (5.106)-(5.107), ou seja 


F(s)=(C-DK)(sI-(A-BK)) BKM+DKM (5.109) 


que é exatamente a função de transferência do sistema em malha fechada contro- 
lado por realimentação de estado como se o estado estivesse disponível para reali- 
mentação. Estas propriedades, até certo ponto surpreendentes, resultam verdadeiras 
devido às estruturas muito particulares das matrizes que definem a representação 
de estado (5.106)-(5.107), em especial, a matriz dinâmica é triangular superior e 
as n últimas linhas da matriz de entrada são nulas. Desta forma, os autovalores 
da matriz dinâmica são os autovalores dos seus dois blocos diagonais e o sistema 
não é controlável pois o erro de observação não pode ser modificado pelo sinal de 
referência. Decorrentes destes cálculos, os fatos mais relevantes são: 


e À estabilidade e o desempenho do sistema em malha fechada são consequências 
de escolhas independentes dos ganhos K e L. 
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e A função de transferência entre a referência e a saída é idêntica àquela obtida 
via realimentação de estado, como se o estado estivesse disponível para reali- 
mentação. Como anteriormente, podemos determinar o ganho M ou a função 
M(s) de tal forma a assegurar um desempenho adequado em regime perma- 
nente. 


Estas propriedades decorrem de um resultado muito mais geral denominado Teo- 
rema da Separação que é válido para esta estrutura de controle inclusive quando 
for sujeita a ruídos externos estocásticos. Ele permite que a estratégia de projeto 
de servomecanismos seja decomposta em duas etapas independentes. O ganho L 
é determinado com critérios de desempenho restritos à observação de estado e, em 
seguida, os ganhos K e M são determinados a partir dos critérios de desempenho 
de controle. 

Com esses ganhos, é importante discutirmos a maneira mais simples possível de 
implementar o controle calculado. Aplicando a transformada de Laplace em (5.101), 


obtemos 
û = hf — Ko (5.110) 


onde h = KM e Kĉ, pode ser determinada aplicando a transformada de Laplace 
na equação 
to = (A — LC)zo + (B — LD)u + Ly (5.111) 
que decorre da simples substituição de (5.100) em (5.99), isto é 
Kão = Culs)û + Cy(s)ĝ (5.112) 


onde as funções de transferência Cu(s) e Cy(s) são dadas por 
=z 
Cu(s) = K(sI-(A-LC)) (B-LD) (5.113) 
Ei 
C(s) = K(sI-(A-LC)) L (5.114) 


A Figura 5.10 mostra a implementação final do controle que realimenta apenas as 
variáveis disponíveis em cada instante de tempo. Note que as funções de trans- 
ferência Cu(s) e Cy(s) estão localizadas na malha de realimentação e são funções 
escalares. A realimentação do sinal de controle passando por Cu(s) é decorrência da 
necessidade dessa informação ser disponível ao observador. 

Finalmente, é preciso comentar que na maioria dos casos que encontramos na 
prática, a saída medida y(t) que é usada para sintetizar a lei de controle não é a 
mesma que temos interesse para definir os critérios de desempenho. Por exemplo, 
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Figura 5.10: Estrutura básica de controle modificada 


em um sistema dinâmico de segunda ordem cujas variáveis de estado são a posição 
e a velocidade do móvel, podemos desejar controlar a posição medindo a velocidade 
e vice-versa. Esses casos são tratados extraindo da equação de estado (5.97) a saída 
de interesse 


z = Cx + D,u (5.115) 


Como continuamos utilizando a saída y definida em (5.98) no observador (5.99), as 
equações de estado (5.106) e (5.107), que descrevem o comportamento do sistema 
em malha fechada, permanecem válidas. Com elas determinamos 


z= [| C,—D:;K D,K |x3+D.KMr (5.116) 


cuja função de transferência entre a referência F e a saída controlada ê é dada por 
= 
FAS) = CDK) (s1 -m BK)) BKM + D.KM (5.117) 


a qual, como vemos, é idêntica à função de transferência F(s) entre a referência 
f e a saída medida % após a substituição do par de matrizes (C, D) por (Cz, Dz). 
Ademais, como podemos fatorar F.(s) = hS.(s) com h = KM e S,(s) uma função 
de transferência escalar como em (5.24), os procedimentos adotados anteriormente 
continuam válidos para determinar o ganho M ou a função de transferência M(s) 
de tal forma a impor um determinado desempenho em regime permanente para a 
saída controlada z definida em (5.115). Esse e outros aspectos relevantes do projeto 
de servomecanismos serão abordados na próxima seção. 

Resta, porém, tratar teoricamente um último aspecto muito relevante relativo à 
introdução de ruído no projeto de servomecanismos como aliás foi feito no Capítulo 2 
a partir da estrutura básica de realimentação ilustrada através da Figura 2.8. Neste 
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caso, as equações de estado do sistema em malha aberta são novamente expressas 


por 
t = Ax+ Bu+w (5.118) 
y = Cr+bu+vo (5.119) 
2 = Cr Du (5.120) 


onde w(t) € R” e v(t) € R são os ruídos presentes nas variáveis de estado e de saída, 
respectivamente e z é a saída de interesse. Como anteriormente, a lei de controle 
em malha fechada é dada por u = K(Mr — xo) onde xo(t) é a variável de estado do 
observador 


to = Axo + Bu+ L(y- Yo) (5.121) 


que fornece uma estimativa, em todo instante de tempo, do estado z(t). O objetivo é 
determinar os ganhos (K, L, M) de tal forma a minimizar um critério de desempenho 
a ser discutido em seguida. Adotando uma vez mais à variável de estado aumentada 
ta E€ R?” definida em (5.105), a dinâmica do sistema em malha fechada, de ordem 
2n, é descrita pelas equações 


ta = Ag£a + Bar + Wa | (5.123) 
z = Catat Dar (5.124) 


: ZM an 
onde as matrizes Aa E€ R”*" e Ba E€ R”** são dadas por 


A-BK BK E Ea dai 
As = | 0 Fa | 0 ( ) 

bem como a matriz C, € RIX2 e o escalar Da € RIX! 
Ca = | Cz- D-K DK |, Da = D:KM (5.126) 


Como era de se esperar, essas matrizes são idênticas àquelas do modelo em malha 
frechada (5.106)-(5.107) obtido sem a introdução dos ruídos. Ademais, o ruído wa(t) 


pode ser calculado por a | A | | ms | (5.127) 
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fazendo com que, como consequência direta das características dos ruídos explici- 
tadas em (5.84) e (5.85), a sua média seja nula, isto é 


Eat) pe D yt (5.128) 
e a sua matriz de covariância possa ser escrita como 
E fuawalr) | = Wadlt— 7), Vt,T (5.129) 
onde W, € R”*2" é a matriz simétrica e definida positiva 
i 0 Me A I 
I —L O u O —V | 


UU! UU! 
VU” UU! pit! 


Wa 


Il 


(5.130) 


a qual, entretanto, não é bloco diagonal devido à existência de correlação entre 
diversos elementos do vetor wa(t) segundo claramente estabelecido em (5.127). 

Finalmente, cabe salientar que o sistema em malha fechada está submetido a uma 
determinada condição inicial geralmente expressa por xa(0) = [x(0)' (0)] quando 
o observador for inicializado com condição inicial nula. Muito embora desconhecida, 
a condição inicial do sistema x(0) € R” é um valor determinístico. Como sinal de 
referência r(t) é obviamente conhecido e portanto determinístico, o vetor de estado 
do sistema em malha fechada é um sinal estocástico devido à presença do ruído 
Walt). Assim, a partir da solução geral 


Talt) = e^t za (0) + Í ee (Bar(T) + wa(T))dr (5.131) 


calculando a sua esperança matemática para todo t > 0, e levando em conta (5.128), 
determinamos o seu valor médio 


t 
Talt) = e^*t ra (0) + [ ed) B r(r)dr (5.132) 
O 


Por outro lado, subtraindo (5.132) de (5.131) obtemos 


t 
Aiii J Aei (5.133) 


onde Azalt) = zalt) — Za(t) € R” é um vetor que fornece, em qualquer instante 
de tempo t > 0, o desvio da variável de estado xa(t) em relação ao seu valor médio 
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Za(t). Trata-se, por definição, de um vetor de média nula, para todo t > 0 e com 


variância dada por 


EAn TART = / / efalt=DE Lwa(T)walEy } e^ arde 


t 
2 / Aa) Wy, e4 lt-8 dE 
0 | 


t 
== / efaT W e^aTdr , t>O (5.134) 
O 


Esse resultado é de central importância no presente contexto. Em particular, devido 
à estrutura bloco-triangular da matriz Aa e da estrutura da matriz W, que apresenta 
três blocos idênticos, o cálculo da integral que aparece no lado direito de (5.134) pode 
ser realizado sem dificuldades desde que o ganho do observador seja o ganho ótimo 
obtido através da solução da equação de Riccati (5.77). 


Lema 5.3 Considere que o ganho L do observador seja aquele dado dado pelo Teo- 
rema 5.4. Para todo ganho de controle que estabiliza a matriz A — BK, a seguinte 
igualdade se verifica 


OO 
/ efaT Wei dr = Ra = | PE | apron (5.135) 
O R R | 


onde R € Rº*" é a solução simétrica e definida positiva da equação de Riccati (5.77) 
e S € RX" é solução simétrica e semidefinida positiva da equação de Lyapunov 


(A- BK)S + S(A— BKY +uLL'=0 (5.136) 


Prova: A igualdade (5.135) se verifica desde que a matriz simétrica Qam Aala Tt 
Ra AL + Wa seja nula, ou em outras palavras, Ra seja solução da equação de Lyapunov 
AaRa + RA! + Wa = 0. Com as matrizes A, e Wa dadas em (5.125) e (5.130), 
respectivamente, simples multiplicações permitem determinar Qa, ou seja 


Om = (A-BK)(S+R)+BKR+ (S+ R(A-— BK) + RK'B' + UU' 

(A — BK)S + S(A — BK) + AR+ RA' + UU! 

LE tu RO Ch 

0 — (5.137) 


Il 


Il 
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sendo que a última igualdade decorre de L = u ! RC”. Ademais 


Quo = (A-BK)R4 BKR + R(A- LC) + UU 
= AR+ RA - ROL + UU 

ARE RA — p!RO'CR+ UU 

a (5.138) 


Il 


pois R é a solução positiva definida da equação de Riccati (5.77). E, pela mesma 
razão | 


Quo = (A-LOR+AR(A-LCO) + UU' 4 LL 
= AR+RA' — uy !ROCR+UU' 
= (5.139) 


Desta forma, como Qa deve ser simétrica concluímos que Qa = 0, o que prova o 
lema proposto. O 


Como imediata decorrência da igualdade (5.135), a matriz Ra é semidefinida 
positiva sendo, geralmente, definida positiva. A prova deste lema deixa claro que o 
seu resultado só pode ser estabelecido quando o ganho de observador for o ganho 
ótimo fornecido pela solução da equação de Riccati (5.77). Qualquer outro ganho 


usado no observador, mesmo que estabilize a matriz A— LC, não leva a um resultado 


semelhante. Ademais, o resultado do Lema 5.3 em conjunto com (5.134) permite 
obter uma igualdade importante, qual seja 


1 
lim — 
im zel 


T — coo 


T 
/ Ai Aa at) = (5.140) 
onde Ra € RX" é a matriz dada em (5.135). Essa igualdade decorre do fato da 
variância de Axa(t) tender a uma matriz constante, Ra, quando t > oo. 


Estamos em posição de propor um critério de desempenho para o sistema em 
estudo, da forma 


JK) = lim cê / í (Az(t)'QAz(t) + pAu(t) Au(t)) a) (5.141) 


onde Q e R?*” é uma matriz semidefinida positiva e p > 0. As quantidades Ax(t) 
e Au(t) denotam os desvios das respectivas variáveis em relação aos seus valores 
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médios. Para usar o resultado do Lema 5.3 o ganho L é fixado e depende apenas 
das características dos ruídos. Por este motivo, o critério de desempenho escolhido 
depende apenas do ganho de controle K. Ao minimizá-lo em relação à escolha 
de K, forçamos que as trajetórias do sistema em malha fechada Ax(t) e Au(t) se 


aproximem das suas respectivas médias. Como u = K(Mr — to), temos Au = 
—-K Axo, de tal forma que a igualdade 


| NA E | Mr | 


= Le a GS 


= = | ao (5.149) 


se estabelece, a qual substituída em (5.141), após algumas manipulações permite 
escrever o critério de desempenho da maneira compacta | 


J(K)J= lim GA Ata OGA) at (5.143) 


T50 T 


onde Qa, E€ R"*” é uma matriz simétrica semidefinida positiva dada por 


iotr oe[ E Jie e 


Q+pK'K —pK'K 
| RR GRK (5.144) 


/ 


| 


Qa 


Finalmente, usando (5.140) em (5.143) vem 


lim E | J E Tr(Qa Ata) Aval!) ot) 


T--soo 


T QaRa) 
Tr(QR) + Tr((Q + pK'K)S) (5.145) 


Il 


J(K) 


Il 


a qual permite verificar que o critério de desempenho J(K) é igual à soma de duas 
parcelas, a primeira é constante e depende exclusivamente da matriz À, solução da 
equação de Riccati, que define o observador de estado ótimo e da matriz Q. A 
segunda, que depende da escolha do ganho de controle K, pode ser manipulada a 
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partir da propriedade da funça - 
N ção traço, d 
eo aa ço, discutida no Capítulo 3, de tal forma que a 


] 


T á 00 
r((Q RE pK K)S) wu Tr (Q +- pK'K) / ctA-BKIT T] p A-BK)T ar) 
0 


z= / j A-BK)'T E 
= ALPL 
(5.146) 


fazendo com que o critério de desempenho assuma a forma final 
JK) = Tr(QR) +uL’ PL (5.147) 


e a sua dependênci A 
AF a o o a ganho de controle seja expressa através da ma- 
H e a re omando o estudo já realizado do regulador li- 
Aa a as equações (5.54) e (5.55), notamos que o presente 
e penho é minimizado quando se escolhe K = o !B'P i 
o pen e areia positiva solução da equação de Kei (5 a na 
i ortante ressaltar que os cálculos realizados lev > i 
projeto de servom j x i am à conclusão de que o 
A O R Ea a ação de ruídos externos continua a ser feito de 
id - py pda à determinação das matrizes de ganho de 
E ET oO servador L, ou seja, a propriedade de separaçã 
presente. Desta forma, as seguintes etapas são adotadas: e 


1. Controle : A 
a paru 2 Ra Q e do escalar positivo p que definem os 
os às variáveis de estado e de controle no critério quadrático 
) 


determina-s 

-se o ganh 

ganho K, adotando-se um dos seguintes procedime 

nativos: procedimentos alter- 


e Determina-se a soluça iti ; 
l ção positiva definida P da e E e 
cati (5.48) e a partir dela o ganho K = pi B' Cd matricial de Ric- 


e Com y(s) = sA i 
(s) = V(sI— A) +B, determina-se as raízes situadas no semiplano 


esquerdo complexo da equaçã EE 
ção algébrica (5.5 
polos de A — BK nestas posições. EE R 


O V alor de pP > () mais con V entente. Í 
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A partir das características dos ruídos de estado e de medida 
determina-se o ganho do 


à Observador : 
definidas pela matriz U e pelo escalar positivo H, 
observador L, adotando-se um dos seguintes procedimentos alternativos: 


e Determina-se a solução positiva definida R da equação matricial de Ric- 
cati (5.77) e a partir dela o ganho L = URCO: 


e Com W(s) = C(sl — A) IU, determina-se as raízes situadas no semiplano 
esquerdo complexo da equação algébrica (5.81) eo ganho L que aloca os 
polos de À — LC nestas posições. 


biliza implementar O controle final diretamente através 


Esse procedimento via 
da estrutura ilustrada na Figura 5.9 ou através daquela dada na Figura 5.10. A 


sua importância reside no fato de que não é possível determinar outros ganhos que 
possam produzir um sistema em malha fechada com melhor desempenho medido 
através do critério quadrático considerado. Por outro lado, se olharmos o mesmo 
problema, levando em conta apenas os valores médios das diversas variáveis en- 
volvidas e determinarmos OS ganhos M, K e L as trajetórias do sistema em malha 
fechada, quando submetido aos ruídos, serão adequadas também no que diz respeito 
à pequena variância que apresentarão em relação à suas respectivas médias. Esses 


aspectos serao ilustrados em seguida. 
5.6 Projeto Final 


Vamos considerar novamente O modelo do pêndulo invertido com massa m e 
comprimento £ montado sobre um carro com massa M em um meio isento de atrito, 


já tratado no Capítulo 2 e ilustrado na Figura 2.6. O objetivo é equilibrá-lo na 


posição vertical pela ação de uma força horizontal com intensidade F. As equações 


do movimento, já linearizadas, são dadas na forma 


(M +mi-mto = F (5.148) 
0-2x—-9) = 0 (5.149) 


orizontal do carro e 0 = ọ — 90º é o deslocamento angular 


onde Léo deslocamento h 
do o vetor de estado Lp = 


do pêndulo medido em relação à vertical. Consideran 
le 40 0] € Rt, a variável de controle u = F, e os valores numéricos já fornecidos 


no Exemplo 2.3, isto é M = 10,0 [kg], m = 2,0 [kg], 4 = 1,0 Imj e g = 9,8 [m/s?], as 
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equações de estado se escrevem como 


O 1,0000 0 0 0,0 

| 0 O 1,9600 0 0,1 

o 0 DE oo go ao) 
0 O 11,7600 0 0,1 

y = [1 0 —1 0] (5.151) 


onde a variável de saída medida é o deslocamento horizontal do pêndulo y = z + 
lcos(0 + 7/2) = x — £0. Diferentemente da solução via realimentação de estado 
apresentada no Capítulo 2, agora assumimos que podemos medir em cada instante 
de tempo t > 0 apenas a variável y(t). 

Inicialmente, o objetivo é equilibrar pêndulo na posição vertical e, simultanea- 
mente, levar o carro para a origem do referencial inercial adotado. O ganho de 
controle K foi determinado a partir da solução da equação de Riccati (5.48), com 


Q = diag(1,0,1,0), p = 107? (5.152) 


ficando claro que apenas os deslocamentos e não as velocidades do carro e do pêndulo 
são penalizados, ou seja 


K =| —10,0000 —21,4443 3429299 103,0445 l (3:153) 


A matriz A— BK tem autovalores —3,4307+ 40,1475 e —0,6493+ j0,6399 o que indica 
que os polos dominantes têm um fator de amortecimento de aproximadamente 0,7 
correspondente a uma margem de fase aproximada de 70º, que são valores bastante 
adequados. Como o sinal de referência é nulo, r(t) = 0,Yt > 0, qualquer valor não 
nulo para o ganho M pode ser adotado como, por exemplo, aquele que satisfaz a 
normalização h = KM = 1. Em seguida, e de forma independente, o ganho do 
observador L foi determinado através da solução da equação de Riccati (5.77), com 


U = 10"! x diag(1,1,1,1), Vu = 10"? (5.154) 
fornecendo 
L= | —25,2191 —35,9366 —46,1407 —154,7921 | (5.155) 


de tal maneira que a matriz A — LC é assintoticamente estável como atestam os seus 
autovalores — 14,4627, —2,7269 + 50,8753 e —1,0050. Observe que U € RºX* indica 
que o ruído w(t) € Rt age independentemente nas quatro equações de estado. 
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Figura 5.11: Simulação no tempo 


O controle foi implementado a partir das funções de transferência Cu(s) e Cy(s), 
dadas em (5.113)-(5.114), que são calculadas a partir dos ganhos K e L já determi- 
nados, isto é 

o 8,16(s + 15,93)(s? + 9,071s + 62,28) (5.156) 

Gule) = (s + 14,46)(s + 1,005) (s2 + 5,454s + 8,202) l 
—3,0750 x 10%(s + 3,429) (s? + 0,0405s + 0,0113) (5.157) 

A = (s + 14,46) (s + 1,005) (s2 + 5,454s + 8,202) 
A Figura 5.11 mostra a simulação no tempo, sem ruídos, do deslocamento horizon- 
tal do carro (parte superior) e do deslocamento angular do pêndulo em relação à 
horizontal (parte inferior). No instante inicial t = 0, o carro está em repouso na 
origem e o pêndulo está em repouso em uma posição que forma um ângulo de 45° 
com a horizontal. As trajetórias em linhas contínuas foram obtidas com o controle 
definido pelas funções de transferência Cu(s) e Cy(s) enquanto que, para a devida 
comparação, em linhas tracejadas, mostramos as trajetórias obtidas com o controle 
de realimentação de estado u = —Kx, com o ganho K dado em (5.153), assumindo 
que todos os estados sejam medidos em todo t > O. Como era de se esperar, o con- 
trole via realimentação de estado faz com que o sistema em malha fechada tenha um 
desempenho muito superior pois dispõe de muito mais informações que estão pre- 
sentes em todo o vetor de estado x(t) € Rº do que simplesmente aquelas fornecidas 

pela saída y(t) ER. 


fico 
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Para os mesmos ganhos de controle K e do observador L, consideramos dois 
outros aspectos bastante relevantes em qualquer projeto de sistema de controle. As 
versões digitais dos controladores Cpu(z) e Cpy(z) foram calculadas introduzindo- 
se um segurador de ordem zero em cada uma das respectivas entradas e período de 
amostragem de T = 30 [ms]. O procedimento discutido no Capítulo 2 fornece 

0,2603(2z — 0,6196) (22 — 1,714z + 0,7624 
code) = PME OBA? - LTI +0762) q 
(z — 0,9708)(z — 0,648)(22 — 1,8422z + 0,8491) 
| —7,1318 x 102(z — 0,9023)(22 — 1,999z + 0,9989 
Gs TC has 
| (z — 0,9703)(z — 0,648)(22 — 1,842z + 0,8491) 
Finalmente desejamos projetar o ganho h = KM de referência de tal forma que a 
primeira variável do sistema em malha fechada que corresponde ao deslocamento 
do carro acompanhe um degrau unitário com erro nulo em regime permanente. 
Portanto, definindo C, = [1000] e D; = 0 determinamos F,(0) = hS.(0), onde 


S(0)=(D,K - C)(A- BK) !B+D,=-0.1 (5.160) 


o que impõe h = —10 para assegurar que F.(0) = 1 como desejado. Embora uma 
análise do comportamento físico do sistema permita concluir que adotando esse 
ganho de referência estaremos também assegurando que 9(t) — 0, podemos verificar 
que esta propriedade decorre imediatamente de F.(0) = hAS.(0) = 0,Yh € R pois 
S-(0) = 0 para C, = [0 0 1 0] e D; =0. 


A Figura 5.12 mostra novamente a simulação no tempo do sistema em malha 


fechada. Em linhas contínuas vemos as trajetórias do sistema controlado com Cu(s), 
Cy(s) enquanto que em linhas pontilhadas mostramos o sistema controlado com as 
suas versões digitais Cpu(z), Cpy(z). Inicialmente consideramos r(t) = 0 durante 
o intervalo de tempo 0 < t < 5 [s] fazendo com que o carro equilibre o pêndulo na 
vertical e volte à origem x = 0. Em t = 5 [s], a referência muda para r(t) = 10, indi- 
cando que o carro deve equilibrar o pêndulo e se deslocar para a posição x = 10 [m]. 
Observe que o sistema em malha fechada atende perfeitamente essas especificações. 
Ademais, é aparente a queda de desempenho que se acentua conforme o período 
de amostragem aumenta, até o limite de estabilidade que ocorre, aproximadamente, 


para o período de amostragem máximo Imaz = 50 [ms]. 


Finalmente, resta informar que realizamos diversas simulações adicionando ruídos 
brancos de diferentes intensidades nas variáveis de controle e de saída. Verificamos 
que o controle aqui proposto se comportou de forma bastante adequada. Em par- 
ticular, mesmo para a situação em que os ruídos w(t) e v(t) usados na simulação 
eram definidos por U = 107!B e yu = 107? de tal forma a impor que w(t) seja 
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t [s] 


Figura 5.12: Simulação no tempo 


um ruído aditivo à variável de controle u(t), os gráficos das trajetórias dos desloca- 
mentos do carro e do pêndulo, para todos os efeitos práticos, coincidem com aqueles 
apresentados na Figura 5.12. 


5.7 Notas Bibliográficas 


Neste capítulo, tratamos de aspectos que reputamos essenciais da teoria de 
controle moderna. O tratamento de sistemas de controle via representação de es- 
tado permite que alguns problemas de controle ótimo sejam resolvidos empregando 
técnicas que os colocam ao alcance dos alunos de graduação. Muito embora eles 
já tenham sido tratados em diversos textos disponíveis na literatura, tais como em 
[2], [8], [13], [14] e [25], acreditamos ter atingido e colocado em evidência os pontos 
essenciais de maneira mais simples e direta. O capítulo começa relembrando a repre- 
sentação de estado de funções de transferência para, em seguida, tratar o problema 
de alocação de polos via realimentação de estado. Em seguida, o problema linear 
quadrático é resolvido através da solução da equação de Riccati ou através de um 
lugar das raízes bastante peculiar, denominado lugar das raízes simétrico. Neste 
ponto o texto [26] é primoroso e deve ser consultado sempre que possível. O mesmo 
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é feito para o projeto de observadores de estado que comportam o estudo de proces- 
sos estocásticos simples, [26]. O projeto de servomecanismos é atacado com base na 
propriedade de separação entre controle e estimação, essencial para que o respectivo 
problema possa ser tratado de maneira eficaz. O capítulo termina com um projeto 
que ilustra o desenvolvimento de um sistema de controle para um processo real, de- 
talhando todos os seus passos até a sua validação por meio de simulação numérica. 
Tópicos mais avançados tais como controle robusto e controle multivariável não 
foram tratados. Acreditamos, entretanto, que o material aqui exposto pode servir 
de base para que eles sejam abordados, no futuro, pelo leitor com maior interesse 


“nestes temas específicos, ver [8] e [9]. No caso particular de robustez, o Capítulo 7 


é inteiramente dedicado a um estudo preliminar deste tema. 


5.8 Exercícios 


Exercício 5.1 Considere a seguinte equação diferencial, com condições iniciais nulas 
Y + 34 + 2y = ù + 3u 
a) Determine sua representação de estado. 


b) Para u(t) =1, Y t > 0, determine o valor da saída y(t) em regime permanente. 


c) Considere que a entrada u(t) deve ser sintetizada através de um projeto via reali- 


mentação de estado, isto é u(t) = r(t) — Ka(t), onde z(t) é o vetor de estado. Calcule 
o ganho matricial K de tal forma que o erro em regime permanente para uma re- 
ferência r(t) do tipo degrau seja igual a 25% e que os polos do sistema em malha 
fechada tenham fator de amortecimento igual E = 2/2. 


Exercício 5.2 Um sistema dinâmico a tempo contínuo de fase mínima possui uma função 
de transferência em malha aberta G(s), cujo diagrama de Bode assintótico de módulo é dado 
pela Figura 5.13 


a) Considerando (s) = G(s)ú(s), determine sua representação de estado. 


b) Supondo que todos os estados do sistema possam ser medidos e denotando r(t) o 
sinal de referência, adote a estratégia de controle via realimentação de estado û(s) = 
f(s)— K&(s), onde x é o estado do sistema, e calcule o vetor K de forma que os polos 
do sistema em malha fechada sejam —2 e —3. 


c) Calcule o erro em regime permanente para r(t) igual a um degrau unitário. 


d) Se possível, calcule outro valor de K para que o erro para uma referência degrau 
unitário seja nulo, mantendo um dos polos em malha fechada em —2. 
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À 
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Figura 5.13: Diagrama de Bode de módulo. 
Exercício 5.3 Um sistema de dinâmico a tempo contínuo de fase mínima é representado 


por uma função de transferência em malha aberta G(s), cujo diagrama de Bode assintótico 
de módulo é dado pela Figura 5.14 


—20 dB/dec 


A 


l rad/s 2 rad/s 


Figura 5.14: Diagrama de Bode de módulo. 


a) Considerando a relação entrada-saída y(s) = G(s)ú(s), determine sua representação 
de estado. 


b) Sendo r(t) o sinal de referência e x(t) o vetor de estado do sistema, para o controle 
via realimentação de estado u = r — Kz, determine o ganho K de modo que os polos 
do sistema em malha fechada tenham constante de tempo de 1/3 [s]. 


c) Com o ganho determinado no item b) e r(t) = 6sen(3t), calcule a saída y(t) para t > O 
suficientemente grande. 


Exercício 5.4 Um sistema dinâmico a tempo contínuo é descrito pela seguinte equação 
diferencial 


j-2y+y=u, y(0)=0, 9(0)=1 


a) A partir de sua representação de estado determine um observador de estado de tal 
forma que a constante de tempo de seus polos seja de 0,5 [s]. | 


b) Determine, em função de t > 0, o erro cometido pelo observador obtido no item a) 
para estimar y(t) V t > 0 a partir de condições iniciais nulas. 


i 
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Exercício 5.5 Seja G(s) a função de transferência de um sistema dinâmico de fase mini- 
ma a tempo contínuo, cujo diagrama de Bode assintótico de módulo é dado na Figura 5.15 


14 dB- E = 


20 dB/dec —20 dB/dec 


A 


ji rad/s 2 rad/s 


Figura 5.15: Diagrama de Bode de módulo. 


a) Obtenha a função de transferência G(s), esboce seu diagrama de Bode de fase e estime 
sua margem de fase. 


b) Determine a representação de estado para o sistema j(s) = G(s)û(s). 


c) Projete um observador de estado com polos cujas constantes de tempo sejam 0,20 [s] 


e 0/25 [s]. 


d) Considerando u(t) = 1 Yt > 0, condições iniciais do sistema x(0) = [1 0|’ e condições 


iniciais nulas para o observador, determine o erro cometido ao se estimar a segunda 
variável de estado V t > 0. 


Exercício 5.6 Considere o sistema mecânico da Figura 5.16, no qual as massas têm os 
valores M = 5 [kg], m = 2 [kg], a constante de mola vale k = 100 [N/m] e o coeficiente de 
atrito viscoso é dado por b = 4 [Ns/m]. 


b 
E f(t) 
Hi 
EE RO 


Figura 5.16: Massas acopladas por amortecedor. 
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a) Deseja-se projetar um controlador via realimentação de estado de modo que os polos 
do sistema em malha fechada tenham fator de amortecimento igual a 0,707 e constante 
de tempo de 2 |s]. E possível atender a especificação? Explique. 


Pi 


b) Supondo que se consiga medir apenas a posição z(t) da extremidade da mola onde é 
aplicada a força f(t), é possível determinar um observador de estado de modo a obter 
a velocidade da massa M? Explique. 


c) Insira uma mola de constante elástica k = 100 |N/m] entre as massas M em e refaça 
os itens anteriores. 


Exercício 5.7 Um sistema dinâmico a tempo contínuo tem como função de transferência 


o 2(s + 4) 
O Ralo 


a) Determine a representação de estado da relação entrada-saída y(s) = G(s)ú(s). 


b) Supondo que todas as suas variáveis de estado possam ser medidas, projete um con- 
trolador via realimentação de estado de modo que: 


e a máxima sobre-elevação para uma entrada degrau seja menor ou igual a 30%. 
e o tempo de estabilização não ultrapasse 2 |s]. 
e a largura de faixa não ultrapasse 50 [Hz]. 


e o erro para uma entrada degrau seja nulo. 


c) Pensando apenas no projeto do regulador, suponha que desejamos implementar o con- 
trolador obtido no item b) através de um controlador PID. Qual deve ser a variável 
de estado a ser medida? Qual é a função de transferência do controlador? 


d) A partir da medida da saída y(t) do sistema em malha aberta, determine um ob- 
servador de estado, com polos alocados adequadamente, capaz de fornecer todos os 
estados do sistema, V t > 0. 


e) Refaça o projeto do item b) utilizando o observador de estado projetado no item d) e 
avalie, utilizando um pacote computacional, a resposta ao degrau do sistema em malha 
fechada para os dois projetos. 


Exercício 5.8 Um sistema a tempo contínuo tem como função de transferência em malha 


aberta 
1 
G STEE 
(5) s(s + 1) 


a) Determine a representação de estado da relação entrada-saída y(s) = G(s)ú(s). 
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b) Supondo que todas as suas variáveis de estado possam ser medidas, calcule um ganho 
matricial K, de modo que a lei de controle u(t) = r(t) — Ka(t) posicione os polos do 
sistema em malha fechada numa região do plano complexo de modo que suas constantes 
de tempo sejam de 0,5 |s| e seu fator de amortecimento igual a 0,5. 


c) Se quisermos implementar o controlador obtido no item b ) como um PD, qual variável 
de G(s) deve ser medida? Qual a função de transferência do controlador? 


d) Supondo que apenas a saída y(t) é mensurável, projete um observador de estado que 
forneça y(t) Vt >0. 


e) Refaça o projeto do item b) resolvendo o problema linear-quadrático, considerando 
peso 0,5 sobre a primeira variável de estado. Calcule o peso sobre o sinal de controle 
u(t) de modo que o sistema em malha fechada não apresente oscilação e possua o 
menor tempo de estabilização possível. 


Exercício 5.9 Um sistema dinâmico a tempo contínuo tem como função de transferência 
em malha aberta 


1 
OS s(s + 1)(s +2) 


a) Determine a representação de estado correspondente à relação entrada-saída (s) = 


G(s)û(s). 


b) Supondo que todas as variáveis de estado do sistema possam ser medidas, projete 
um controlador via realimentação de estado, alocando os polos do sistema em malha 
fechada de modo a garantir: 


e margem de fase maior ou igual a 40°. 
e largura de faixa entre 0,5 [Hz] e 10 [Hz]. 
e erro nulo para uma entrada do tipo degrau. 


c) Refaça o projeto do item anterior, mas agora alocando os polos do sistema em malha 
fechada de modo que o controlador resolva o problema de otimização 


min J [6,2512(t) + 2,571 (t)xa(t) + 0,25x5(t) + pu(t)| dt 
0 


onde x(t) = [xı (t) vo(t) x3(t)| é o vetor de estado do sistema. 


Calcule p > O através do lugar das raízes simétrico de forma que os polos dominantes 
do sistema em malha fechada tenham fator de amortecimento 0,86. Determine a 
localização de todos os polos em malha fechada e, em seguida, calcule o ganho de 
realimentação de estado K que os posiciona nos valores desejados. 


d) Supondo que apenas a saída y(t) da planta G(s) está disponível para medição, refaça 
o projeto do item b) utilizando um observador de estado para gerar todas as variáveis 
de estado. Aloque convenientemente os polos do observador. 
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e) Refaça o projeto do item anterior, alocando os polos do observador de estado assu- 
mindo um erro de 5% na medição de y(t), isto é, u = 25 x 1072 e que um erro de 
10% no sinal de controle implementado, isto é, U = 107!B. Resolva a equação de 
Riccati associada ao problema linear-quadrático utilizando um pacote computacional. 


f) Compare os projetos realizados nos itens d) e e) fazendo a simulação numérica do 
projeto ao adicionar ruídos brancos ao sinal de controle e à saída y(t). 


Exercício 5.10 Considere o sistema de controle com realimentação unitária apresentado 
na Figura 5.17, onde a planta G(s) e o controlador C(s) admitem as seguintes representações 


eo ot 


Figura 5.17: Sistema com realimentação unitária. 


de estado: 


ud E Axt Bu f ż = (Ã-LO Bu- Le 
G(s) : À fds, Ml C(s): | TE 
sendo K e L ganhos matriciais a determinar. 


a) Interprete o funcionamento do controlador C(s) através de sua representação de es- 
tado. 


b) Mostre que se as matrizes (A— BK) e (A — LC) forem estáveis, então o sistema em 
malha fechada é estável. 


c) Para cada uma das funções de transferência G(s) dadas a seguir, projete um contro- 
lador C(s) de acordo com a estrutura da Figura 5.17, de modo que: 
e o erro para uma entrada do tipo degrau seja nulo. 
e os polos em malha fechada tenham constante de tempo menor do que 0,5 [s]. 
e a máxima sobre-elevação para uma entrada degrau seja de, no máximo, 40%. 


e o sistema em malha fechada rejeite ruídos a partir da faixa de 100 [rad/s]. 


1 


i) G(s) = 


s+ 1 
s+5 
(s + 2)(s + 10) 


1%) G(s) = 
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d) Refaça os projetos do item anterior no contexto do problema-linear quadrático 


min J [x2 (t) + pu?(t)| dt 


no qual xı(t) é a primeira variável de estado de G(s) na representação canônica 
controlável. Determine p > 0 através do lugar das raízes simétrico, segundo as especi- 
ficações impostas e, em seguida, calcule os ganhos K e L. 


e) Refaça os projetos dos ganhos L no item d) supondo que o sinal de controle u(t) seja 
implementado com erro de 5%, isto é, U = 5 x 1072B, e a saída y(t) seja medida 
com erro de 10%, ou seja, u = 1072. Utilize um pacote computacional para resolver 
a equação de Riccati associada a esse problema. 


Exercício 5.11 O modelo em espaço de estado para o problema de controle potência ativa- 
frequência em um gerador síncrono é expresso por 


—5 0 —100 0 5 
T E 2 -2 O x + 0 ôPa+ | 0 | ôP 
O 0,1 —0,08 —0,1 0 
| p S l 0 0 1 l X 

onde a saída y(t) representa a frequência da rede de energia elétrica. 
a) Projete um controle via realimentação de estado do tipo ôP, = —Kx, e determine K 
de modo que o tempo de estabilização do sistema em malha fechada seja menor que 

2,5 [s]. 


b) Considerando o projeto do servomecanismo ôP. = K(MôPa — x), calcule M para que, 
em regime permanente, a variação na potência exigida pela carga àPa não afete a 
frequência da linha. 


Exercício 5.12 Um sistema a tempo contínuo caracterizado pela função de transferência 


100 


Ei s(s + 5)(s + 10) 


será controlado através de um computador digital, com período de amostragem de 10 [ms]. 
Considerando a função de transferência discretizada através de um segurador de ordem zero, 
de modo que todos os seus estados possam ser medidos, projete um ganho de realimentação de 
estado K e um vetor de ganhos M de forma que o sistema se comporte como um equivalente 
contínuo com polos dominantes com constante de tempo de 0,25 |s] e fator de amortecimento 
0,707, além de apresentar erro nulo para uma entrada do tipo degrau. 


Capítulo 6 


Sistemas Nao Lineares 


6.1 Introdução 


Neste capítulo, propomos um breve estudo de alguns tópicos envolvendo sis- 
temas dinâmicos não lineares. Nos restringimos ao estudo de sistemas a tempo 
contínuo, descritos por equações diferenciais não lineares com coeficientes invari- 
antes no tempo. Como o nome deixa claro, uma equação não linear se caracteriza 
por não obedecer o Princípio da Superposição, isto é, a partir de condições iniciais 
nulas, se duas funções são soluções, então a soma de ambas não será necessaria- 
mente uma solução. Como não é possível ter ferramentas e resultados teóricos que 
sejam válidos para qualquer sistema não linear, algumas classes mais importantes são 
identificadas e estudadas com maiores detalhes. Ademais, tenta-se aplicar os vários 
resultados válidos para sistemas lineares, adotando-se aproximações no espaço de es- 
tado ou no espaço de frequências, sendo que esta última aproximação resulta em uma 
técnica bastante conhecida, denominada linearização harmônica. Vários exemplos 
ilustrativos são resolvidos e comentados. 


6.2 Equações Diferenciais Não Lineares 


Geralmente, ao modelarmos um sistema dinâmico real, obtemos um modelo não 
linear. Por exemplo, ao modelarmos um móvel qualquer em movimento de rotação, 
é comum fazermos uso de funções trigonométricas para expressar sua posição em 
relação a um referencial inercial escolhido. De fato, como sabemos, a equação dife- 


225 


226 CAPÍTULO 6. SISTEMAS NÃO LINEARES 


rencial que rege o deslocamento angular 0(t) de um pêndulo simples, em um ambiente 
desprovido de atrito, com comprimento £, medido em relação à vertical, pode ser 
expressa na forma 


9 + (9/º) sen(0) = 0 (6.1) 


Trata-se de uma equação diferencial de segunda ordem não linear por causa da 
presença da função sen(0). Infelizmente, dadas as condições iniciais 9(0) e 9(0), não 
é possível escrevermos a sua solução 0(t) em forma fechada, restando como única 
alternativa, determiná-la numericamente através de simulação numérica. Por outro 
lado, considerando pequenos deslocamentos em relação à vertical, a aproximação 
sen(9) ~ 0 é válida e obtemos o modelo aproximado 


à+ (9/08 =0 (6.2) 


que é linear, invariante no tempo e admite como solução 


O(t) = a sen (y5 + ) (6.3) 


onde a e b são constantes que dependem exclusivamente das condições iniciais 6(0) 
e 9(0). Muito embora não tenhamos em mãos a solução da equação não linear (6.1), 
podemos compará-la com a solução aproximada (6.3) através da determinação das 


respectivas trajetórias no chamado plano de fase que nada mais são que os gráficos 


das soluções desenhadas no plano (Ó(t),0(t)) para todo t > 0. Definindo uma nova 
variável como sendo a velocidade angular do pêndulo v(t) = (t), temos 


e reescrevendo (6.1) na forma ù + (9/º) sen(9) = 0, obtemos a relação diferencial 
vdv + (9/!)sen(9)dô = 0, válida para toda trajetória no plano (0,v). Via integração 
de linha, procedimento que será estudado detalhadamente mais adiante, determi- 
namos 


v? — 2(g/L)cos(0) = c (6.5) 


onde c é uma constante. Cada valor desta constante seleciona uma trajetória es- 
pecífica do plano de fase. Por outro lado, adotando o mesmo procedimento para a 
aproximação linear (6.2), obtemos a equação das trajetórias na forma 


v? + (g/ġ =d (6.6) 
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Figura 6.1: Planos de fase do pêndulo simples 


onde d é uma constante que permite selecionar uma trajetória específica. Para 
muito pequeno, o desenvolvimento em série de Taylor estabelece a aproximação 
cos(0) ~ 1—0? /2, fazendo com que as equações (6.5) e (6.6), com d = c+2g/£, fiquem 
idênticas. Isto mostra que a aproximação adotada é boa para pequenas oscilações 
do pêndulo mas perde precisão à medida que esta hipótese deixa de ser válida. 
Alguns pontos do plano de fase, denominados pontos de equilíbrio, merecem 
atenção especial. Como veremos a seguir com maiores detalhes, eles se caracterizam 
por serem soluções constantes no tempo, ou seja, O(t) = Oe e, consequentemente, 
v = 0(t) = O para todo t > 0. No caso da equação diferencial não linear (6.1), os 
seus pontos de equilíbrio são tais que sen(9.) = 0, ou seja, são todos os pontos do 
plano de fase com coordenadas (0,7) = (kr,0) com k = 0,+1,-:-. Por outro lado, a 
equação diferencial linear (6.2) exibe apenas um ponto de equilíbrio com coordenadas 
(0,7) = (0,0). Esta é uma das muitas diferenças entre sistemas lineares e não lineares 
que devem ser levadas em conta em qualquer etapa de análise de desempenho ou 
de síntese de controle. O exemplo dado a seguir ilustra as afirmações feitas até o 


presente momento. 


Exemplo 6.1 A Figura 6.1 mostra dois planos de fase de um pêndulo simples com com- 
primento £ = 1,0 [m], oscilando em um ambiente sem atrito com g = 9,8 [m/s*]. A parte 
esquerda mostra o plano de fase do modelo não linear (6.1) onde se nota três pontos de 
equilíbrio marcados com “x”. A parte direita mostra o plano de fase do modelo linear 
aproximado (6.2) com apenas um ponto de equilíbrio na origem, isto é, (90,v) = (0,0). 
Para pequenas oscilações, em que as trajetórias permanecem em uma região próxima da 
origem, os dois planos de fase são bastante parecidos, indicando que a aproximação adotada 
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é válida. Porém, fora dessa região, a aproximação claramente deixa de ser válida e o modelo 
linear não mais representa adequadamente o modelo original não linear. Além disso, existe 
uma diferença qualitativa entre ambos. Ao contrário do gráfico da esquerda, o da direita é 
composto exclusivamente por trajetórias fechadas. o 


De maneira geral, uma equação diferencial de ordem n resulta de uma relação 
não linear envolvendo uma determinada variável y(t) € R e suas derivadas suces- 


.e 


sivas y(t), y(t),--- até ordem n — 1, para todo t > 0. Assim sendo, ela admite a 
representação de estado 


H(t) = Fe) (6.7) 
onde z(t) € R” é o vetor de estado geralmente definido pela variável y(t) e suas 
derivadas sucessivas, isto é, x;(t) = yt-D(t) para todo i = 1,::-,n. A função não 
linear f(x): R” — R” define completamente cada equação diferencial de interesse e 


suas características algébricas permitem assegurar a existência de solução, a partir 
de uma dada condição inicial x(0) = xo € R”, para todo t > 0. 


Definição 6.1 (Ponto de equilíbrio) O ponto ze E€ R” do espaço de estado é um 
ponto de equilíbrio de (6.7) se «(0) = x. implicar em que x(t) = xe para todo t > 0. 


Em outras palavras, a partir de t = 0 a solução da equação diferencial deve ser 
constante em relação ao tempo. Assim sendo, verificamos imediatamente que os 
pontos de equilíbrio de (6.7) são caracterizados por 

| 


f(x) = (0 | (6.8) 


isto é, são as soluções de um sistema de n equações algébricas não lineares. Por 

este motivo, em geral, a determinação dos pontos de equilíbrio de uma equação 

diferencial, requer o uso de rotinas numéricas. No caso linear em que f(x) = Ar 

com 4 € R?*”, os pontos de equilíbrio satisfazem o sistema linear Axe = O o qual 

admite a solução única xe = 0 sempre que A for uma matriz não singular. 
Integrando ambos os lados de (6.7) obtemos a forma alternativa 


OR / jei (6.9) 


“que permite introduzir um método numérico capaz de determinar solução da equação 


diferencial (6.7) em um intervalo de tempo t € [0,7], previamente especificado. 
Trata-se do Método de Picard que pode ser resumido pelo processo iterativo 


2) = 20 + I fa" (rdr: Vte [0,7] (6.10) 
0 
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válido para todo k = 0,1,--- e que se inicia com uma trajetória qualquer, geralmente 
obtida a partir da condição inicial, isto é, qº(t) = xo para todo t € 0,7). A 
importância teórica desse método é dada no próximo teorema. 


Teorema 6.1 Considere que f(0) = 0. Se existir uma constante finita k > O de 
tal forma que |f(x) — F) < elle — yll ,Vx,y € R” então a equação diferencial 
não linear (6.7) admite uma e apenas uma solução em qualquer intervalo de tempo 


finito. Ademais, O método de Picard converge para esta solução. 


Este teorema merece algumas considerações. A condição f(0) = O faz com que 
a origem seja um ponto de equilíbrio mas pode ser eliminada impondo-se alterna- 
tivamente que a norma ||f(x0)|| seja finita. A condição expressa pela desigualdade 
f(x) FOI < elx — yll Yz, y € R” é chamada condição de Lipschitz. Pew se 
ter em mente que k € R é uma constante, ou seja, independente de x E€ R” im- 
plicando, por exemplo, que a função f(x) = —x? não a satisfaça. No entanto, a 
equação diferencial x = —x2 com a condição inicial x(0) - 1 admite a solução única 
g(t) = 1/(1 +t) para todo t 2 0, deixando claro o seu caráter apenas suficiente para 
assegurar a existência de solução. A prova do Teorema 6.1 vai além do escopo deste 
livro mas nela fica aparente que o método de Picard converge assintoticamente para 
a solução única de (6.7), desde que o tempo final T seja suficientemente pequeno ou 
que a convergência seja testada a cada m passos onde m é tal que K”T™ Embed. 


Exemplo 6.2 Para a equação linear em que f(x) = Ar com A € Rº*?, a condição de 
Lipschitz é satisfeita com «s = || All, assegurando a existência e unicidade de solução. Neste 


caso, o método de Picard 


t 
rt (E) = xo + / Ax (r)dr, Vt > 0 
0 


com 2º (t) = zo fornece em uma iteração arbitrária k > 0 a função 


ko Aigi 
z(t) = z AI | To 


i=0 


x . At RE 
a qual, para k — oo converge para a solução conhecida z(t) = e2!xo, válida para todo ne 0. 
Neste caso, a interpretação é simples e interessante, a cada nova iteração o método de a 
fornece uma aproximação com um termo adicional da função exponencial. 


Exemplo 6.3 Adotando-se as variáveis de estado x, = 0 e z2 = 0, a equação do pêndulo 
simples (6.1) pode ser escrita na forma (6.7) com f(x) = Ax + bg(cx) em que 


a[o ofen ge esT o] 


f 
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e g(£) = sen(£). Considerando x,y € R? vetores arbitrários, o teorema do valor médio 
assegura que g(cx) = g(cy) + g'(E)(cx — cy) para algum £ € R situado no intervalo entre os 
valores cx e cy. Desta forma, definindo u = maxger |9'(€)| = 1, obtemos 


IF) — Fl = |A(x— y) + bgr) — g(cy) 
< [AIIE — 99] + IolCa(cx) — g(cy)] 
< (AI =+ ulblllcl) la — yll 
mostrando que a condição de Lipschitz é satisfeita para « = || A|| + |b||lcll, o que implica, 
segundo o estabelecido no Teorema 6.1, na existência e unicidade de solução da equação 
diferencial não linear (6.1). O 


Uma equação diferencial qualquer pode admitir uma solução periódica, isto é, 
uma solução que satisfaz a relação z(t) = z(t + Tp) para todo t > 0, sendo Tp > 0 
o seu período. No espaço de estado, o gráfico de z(t) parametrizado em relação a 
t > O é uma ou diversas curvas fechadas. Para ilustração, consideramos inicialmente 
a equação diferencial linear de segunda ordem 


Ti = T2 (6.11) 
to = -Tı (6.12) 


que descreve o comportamento de um oscilador harmônico. Fazendo uma mudança 
: RE E. 

de referencial para coordenadas polares (r, ġ) em que rº = x? + x5 e tg(ġ) = x9/%1, 

simples derivação em relação ao tempo nos permite obter 


LX, + Loo 


Po XI Lo = TITI 
de tal maneira que (6.11)-(6.12) são equivalentes a? = 0 e ġ = —1. Porém, como são 


duas equações diferenciais lineares independentes, as respectivas soluções fornecem 
r(t) = r(0) e (t) = (0) — t para todo t > 0. No espaço de estado, que no 
presente caso é o plano (x1, £2), trata-se de uma trajetória circular que corresponde 
a uma solução periódica com período Tp = 2r [s] e amplitude r (0)? = x1(0)? + z£2(0)? 
dependente das condições iniciais. No plano (£1, £2) todas as trajetórias são fechadas 


e uma delas, em particular, é selecionada através das condições iniciais. Assim sendo, 


não há trajetórias fechadas isoladas. 
Consideramos agora a equação diferencial não linear já na forma de estado 


dt = s+m(l-zi—a) (6.15) 
to = —zı + gz(1-— z? — r2) (6.16) 
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Figura 6.2: Planos de fase com trajetórias fechadas 


que pode ser resolvida adotando-se uma vez mais a conversão em coordenadas po- 
lares. Neste caso, as relações (6.13)-(6.14) fornecem as equações diferenciais de- 
? o 


sacopladas 7 = r(1 — r?) e 4 = —1, cujas soluções são dadas por 
1 
r(t) = ————, ọlt)=¢0)-t, t >20 6.17 
1) = 5 O=O (617) 
onde c = —1 + 1/r(0)2. Para qualquer condição inicial, para t > O suficientemente 
grande a solução tende para uma solução periódica com período Tp = 27 [s] e 
amplitude r(o0) = 1 que independe das condições inicias. No plano (x1,%92), a 


trajetória correspondente a essa solução periódica é isolada. Para qualquer solução 
inicial, no decorrer do tempo, o sistema tende para esta trajetória periódica isolada. 
Esse tipo de trajetória é denominada ciclo limite e, por ser atrativo, é denominado 
ciclo limite estável. 


Exemplo 6.4 A Figura 6.2 mostra os planos de fase (espaço de estado) para o sistema não 
linear (6.15)-(6.16) (à esquerda) e para o sistema linear (6.11)-(6.12) (à direita). Em ambos 
os casos, apenas a origem xe = 0 é um ponto de equilíbrio. A diferença a ser observada é que 
no caso do sistema não linear, nota-se perfeitamente a existência de uma trajetória fechada 
isolada que é atingida, no limite, para qualquer condição inicial. Ao contrário, no caso do 
sistema linear, cada condição inicial define uma trajetória fechada. Ou seja, não existe uma 
trajetória isolada que possa caracterizar um ciclo limite, que é um comportamento exclusivo 


de sistemas não lineares. O 


Como acabamos de ilustrar, os sistemas dinâmicos não lineares podem apresen- 
tar comportamentos que não são observados nos sistemas lineares. Talvez o mais 
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interessante seja a existência de ciclos limites, que são trajetórias isoladas e fechadas 
no espaço de estado. Elas caracterizam soluções periódicas com período, amplitude 
e forma que independem de condições iniciais. Assim sendo, o estudo do com- 
portamento global dos sistemas não lineares requer técnicas específicas para tratar 
cada um deles. Porém, o comportamento local, em regiões próximas aos pontos de 
equilíbrio, pode ser analisado através de aproximações, como mostrado em seguida. 


6.2.1 Linearização 


Para uma equação diferencial expressa na forma (6.7), em que a função f(x) : 
n T i EA A 
R” — R” é diferenciável em relação ao seu argumento, em uma vizinhança de um 
determinado ponto de equilíbrio x. € R”, podemos adotar a seguinte aproximação 
linear dada pela série de Taylor desenvolvida em x = ze, ou seja 


filo) = lee) + DO So eej = ze) =n (6.18) 


que pode ser escrita na forma mais compacta f(x) = f(xe)+A(r—zx.) onde A € Rº*" 
é uma matriz quadrada com elementos 


Qij = dx, Ce) i j=l, n (6.19) 


Definindo a variável auxiliar z(t) = z(t)— ze, lembrando que ze é um vetor constante 
e que f(xe) = 0, a aproximação linear da equação diferencial não linear (6.7) se 
expressa na forma 


dt) = & 


(6.20) 


sujeita à condição inicial z(0) = xo — xe. Em consequência, a partir dessas manipu- 
lações, podemos obter sem dificuldades a solução geral da equação (6.7), na forma 


v(t) = te + (xo — e) (6.21) 


válida para todo t > 0. E claro que se trata apenas de uma solução aproximada, 
válida em uma vizinhança do ponto de equilíbrio considerado. Devemos enfatizar 
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que a matriz A € R"*” com elementos dados em (6.19) também depende do ponto 
de equilíbrio. Isso faz com que a mesma equação equação diferencial (6.7) gere 
diferentes equações lineares aproximadas, cada uma delas válida na vizinhança de 
cada um dos seus pontos de equilíbrio. 


Exemplo 6.5 A partir das variáveis de estado zı = 0 e x2 = Ô, a equação do pêndulo 
simples é escrita na forma 


t RES Ag 


to = —(g/£)sen(zı) 


Os seus pontos de equilíbrio são caracterizados por x2e = 0 e sen(x1e) = O, ou seja £e = 
[km 0]' para todo k = 0, +1,---. Entretanto, com a aproximação linear fornecida pela série 
de Taylor sen(x1) = sen(x1e) + cos(Z1e)(x1 — ie), obtemos 


0 1 


a —(g/tjcos(xie) O 


o que mostra claramente a dependência da matriz A € R2x2 do modelo linear com o ponto de 
equilíbrio considerado. Para o ponto de equilíbrio x. = [0 0], a matriz A acima corresponde 
à representação de estado da equação diferencial linear de segunda ordem (6.2). o 


Exemplo 6.6 A equação diferencial (6.15)-(6.16) admite apenas um ponto de equilíbrio 
te = [0 0]'. Neste caso, com (6.19), obtemos 


ad EA 


e notamos que o sistema linear ż = Az é instável pois os autovalores de A, raízes da equação 
característica A(X) = det(AI — A) = à? — 2A + 2 = 0, são À = 1 +j. Observe que esse 
comportamento está de pleno acordo com aquele que é visto no lado esquerdo da Figura 6.2, 
na vizinhança da origem. E 


A determinação de uma equação linear que ao ser resolvida fornece uma solução 
aproximada de uma equação não linear é um procedimento de impacto importante 
tanto em análise quanto em síntese de controle para sistemas dinâmicos. Entretanto, 
é preciso ficar bastante claras as suas limitações. Em particular, a sua validade só 
pode ser assegurada na vizinhança de cada ponto de equilíbrio fazendo com que, 
longe deles, a equação diferencial não linear tenha que ser diretamente resolvida, 


quase sempre, com o auxílio de rotinas numéricas. 
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6.2.2 Classes Especiais de Sistemas Não Lineares 


Uma maneira natural de estudar os sistemas dinâmicos não lineares, descritos 
por equações do tipo (6.7) é dividi-los em classes que possam evidenciar alguma par- 
ticularidade para tornar o estudo mais simples. Vamos evidenciar duas importantes 
classes, a saber os sistemas tipo Lur'e e os do tipo Persidiskii. 

Os sistemas dinâmicos do tipo Lur'e são aqueles descritos pelas relações algébricas 
e diferenciais 


tlt) = Ax(t) + Buw(t) (6.22) 
y(t) = Ca(t) + Dwtt) (6.23) 
wt) = —o(y(t)) (6.24) 


onde z(t) € R”, w(t) € R, y(t) € R e dy) : R > R é uma função não linear 
qualquer que deve apresentar algumas propriedades, em particular, ela deve ser 
tal que 9(0) = O. Assim sendo, a origem do espaço de estado x = O é um dos 
seus pontos de equilíbrio. Observe, que escrito desta forma, os sistemas do tipo 
Lur'e se caracterizam por apresentar uma estrutura em malha fechada. De fato, 
as equações (6.22)-(6.24) descrevem um sistema linear com entrada w e saída y 
com uma realimentação não linear w = —ọ(y). Ademais, sendo D = 0, com as duas 


últimas equações algébricas obtemos a relação w = — d(y) = —G(C x) que substituída 


na primeira fornece o modelo não linear na forma final 
t(t) = Ax(t) — By(Cx(t)) (6.25) 


Ressalte-se que essa estrutura é bastante conveniente pois facilita diversos estudos 
desta classe de sistemas não lineares. Dentre eles, mencionamos o estudo de esta- 
bilidade feito com o critério de Popov. Entretanto, como veremos, ele requer que 
a parte linear seja assintoticamente estável, isto é, que a matriz A € R?*” tenha 
todos os seus autovalores localizados no semiplano esquerdo complexo e que ¢(-) 
exiba algumas propriedades adicionais específicas. 

Os sistemas do tipo Persidiskii são aqueles descritos pela seguinte equação dife- 
rencial 


r(t) = Ap(x(t)) (6.26) 


onde z(t) € R” e y(x) : R” — R” é uma função não linear qualquer que deve apre- 
sentar algumas propriedades, em particular, )(0) = 0 e y(x) = pi (x1) + YnlEn)l. 
A primeira impõe que a origem seja um dos seus pontos de equilíbrio enquanto que a 
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segunda restringe cada componente da funçao não linear a depender exclusivamente 
da mesma componente do vetor de estado. O estudo de estabilidade desta classe de 
sistemas é bastante simples e é feito com uma função de Lyapunov particular. Ela 
requer como condição necessária para a sua aplicação que o sistema linear, obtido 
com Y(x) = x, seja assintoticamente estável e que i)(:) exiba algumas propriedades 
adicionais específicas. 


Exemplo 6.7 A representação de estado da equação diferencial que rege o comportamento 
de um pêndulo simples que oscila em um ambiente com atrito viscoso é da forma 


Ti = T2 
ta S —(9/0sen(x1) — (b/m )z2 


onde b é uma constante de proporcionalidade entre o torque produzido pela força de atrito 
e a velocidade angular do pêndulo. Considerando as matrizes 


a= o P E [A 0], D=0 


e ġ(y) = sen(y), concluímos que esse sistema é da classe Lur’e. Por outro lado, considerando 


a matriz 
0 1 
A= | —g/£ —b/ ml | 


e p(x) = [sen(x1) z2]', concluímos que ele também é da classe Persidiskii. Observe ainda 
que, ao contrário da matriz A do sistema da classe Lur'e que tem um autovalor nulo, a matriz 
A do sistema da classe Persidiskii tem todos os seus autovalores localizados no semiplano 
esquerdo complexo. o 


É importante salientar que os sistemas dinâmicos pertencentes a essas duas 
classes podem ter qualquer ordem n a qual define as dimensões das matrizes Å, 
B e C. Como veremos mais adiante, o estudo de estabilidade desses sistemas não 
impõe nenhuma limitação quanto à ordem da parte linear o que quer dizer que 
a equação diferencial em questão pode envolver um número elevado de derivadas 
sucessivas de uma determinada variável. 


6.3 Sistemas de Segunda Ordem 


Sistemas dinâmicos não lineares de segunda ordem são importantes pois são os 
modelos matemáticos de um grande número de sistemas físicos como, por exemplo, 
o pêndulo simples e equações diferencias clássicas tais como a de Van der Pol. O 
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estudo desta classe de sistemas é feito através de técnicas específicas que acabam 
tirando proveito do fato de que eles são descritos por apenas duas equações de 
estado acopladas. Desta maneira, as suas trajetórias parametrizadas em relação 
ao tempo podem ser representadas em um plano denominado plano de fase. Mais 
especificamente, esta seção trata de equações diferenciais do tipo 


Yt) + fU yE) =0 (6.27) 


que evoluem no tempo t > 0 a partir de condições iniciais (y(0), y(0)) quaisquer sendo 
f:RxR > R uma função dada. O plano p x q define o plano de fase, onde podemos 
traçar as curvas definidas por (p,q) = (y(t), y(t)) para toda solução de (6.27) e para 
todo t > 0. Essas curvas são denominadas trajetórias. Consequentemente, a equação 
diferencial admite a representação de estado 


po ss O. (6.28) 
q = —J(p,9) (6.29) 


que impõe a relação diferencial qdq + f(p,g)dp = 0, fazendo com que qualquer 
trajetória possa ser caracterizada pela equação 


$ qdq + f (p,q)dp = 0 (6.30) 


Ou seja, se determinarmos a integral de linha indicada no lado esquerdo de (6.30) 
sobre uma curva qualquer do plano de fase, e o valor encontrado for nulo, a curva 
escolhida é uma trajetória da equação (6.27). Essa equação admite uma solução 
bastante simples em uma situação particular mas que ocorre com uma certa regu- 


laridade, qual seja, quando o valor da integral independe do caminho de integração. 
Como se sabe, a condição para que isto ocorra é 


dq of 
ou seja, a função f (p,q) não pode depender da variável q fazendo com que f(p,q) = 
h(p) para alguma função h : R > R. Neste caso, a equação diferencial (6.27) reduz- 
se à forma Y(t) + h(y(t)) = O que representa sistema físicos conservativos, os quais 
não sofrem a ação de forças ou torques dissipativos que dependem da velocidade 
q = y como, por exemplo, as forças de atrito viscoso. Ou ainda, circuitos elétricos 
que não contenham, idealmente, resistências ou condutâncias. Neste caso, já que o 
caminho de integração não importa, partindo de um ponto qualquer (po, qo) ET e 
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percorrendo sucessivamente os segmentos (po, do) — (p, qo) e (p, qo) — (p,q) então o 
ponto final (p,q) também pertence à trajetória 1, desde que 


q P 
f adat | hop =0 (6.32) 
qo po 


Portanto, através da definição da função 


V,a) = 5 + | hp)dp (6.33) 


podemos determinar a forma geral | = f(p,q) : V(p,q) = c}, onde a escolha da 
constante c = V (po, qo) permite selecionar uma trajetória que passa por um ponto 
específico (po, qo) = (y(0), y(0)), definido pelas condições iniciais de (6.27). 


Exemplo 6.8 Novamente, a equação (6.1) que descreve o comportamento dinâmico do 
deslocamento de um pêndulo simples em relação à vertical, em um ambiente desprovido 
de atrito, será usada como exemplo ilustrativo. Adotando as variáveis de estado p = 0 e 
q = 6, re-escrevendo (6.1) na forma mais compacta 9 + wêsen(0) = 0, onde wo = 9/8 é a 
frequência natural de oscilação, identificamos h(p) = wesen(p) e assim 


2 
V(p,q) = T + | ugsen(pjdp 
2 
— = — tojcos(p) 


Portanto, não há dificuldade em determinar a trajetória que passa, por exemplo, pelo ponto 
p = 7/6 [rad] e q = 0 [rad/s] do espaço de estado. De fato, basta impor c = V(m/6,0) = 
—we /2 e obter a equação que define essa tra jetória particular q? — 2wgcos(p) = —wê. Nota-se 
que esse resultado coincide com a equação das trajetórias do pêndulo (6.5) obtida de maneira 
diversa. Finalmente, deve ser ressaltado que se o pêndulo oscilar em um ambiente com atrito 
viscoso um termo proporcional a q = ĝ aparecerá na equação diferencial e, neste caso, a forma 
geral das trajetórias no plano de fase não poderá ser determinada pelo procedimento que 


acabamos de introduzir. O 


Como está claro, o comportamento de um sistema dinâmico não linear de se- 
gunda ordem é analisado através da construção do seu plano de fase, o qual nem 
sempre pode ser calculado explicitamente. Entretanto, ele pode ser calculado nu- 
mericamente com o auxílio de rotinas numéricas que resolvem equações diferenciais 
não lineares. Deve ficar claro que essa limitação tem como origem o fato de que, em 
geral, a equação diferencial (6.27) não admite uma solução y(t) em forma techada 
para todo t > 0. Portanto, em geral, uma análise global do plano de fase só pode 
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Figura 6.3: Plano de fase - nó estável 


ser feita numericamente. O mesmo não ocorre quando se deseja fazer uma análise 
local, isto é, na vizinhança de um determinado ponto do plano de fase. Se o ponto 
escolhido for um dos pontos de equilíbrio do sistema, podemos adotar a aproximação 
linear para determinar um plano de fase aproximado, válido no entorno do ponto 
escolhido. 

De fato, considere a equação diferencial (6.27) com a representação de estado 
(6.28)-(6.29). Os seus pontos de equilíbrio com coordenadas (p.,qe) são tais que 


qe = 0 e f(pe,0) = 0. Na vizinhança de qualquer um deles podemos obter o modelo 


linear aproximado 2 = Aez onde z = [p — pe q — qel! € R? e 


O l) 
Ae=| əf af (6.34) 
Op Oq 


(pe,qe) 


Como vimos anteriormente, por se tratar de um sistema linear, não há dificuldade em 
obter sua solução z(t) para todo t > 0 e, em seguida, as coordenadas (p(t), g(t)) para 
todo t > O. Vale mais uma vez relembrar que essas funções são apenas aproximações 
da solução y(t) da equação diferencial (6.27) e de sua derivada y(t), respectivamente. 
Vamos considerar dois casos: 


e Autovalores de Ae são reais : Supondo que os seus autovalores À e u 
sejam distintos, com os autovetores a eles associados vy € Rº e Dj: E R? 
determinamos a matriz de similaridade não singular V = [v, vu] € R2 de 
tal forma que V-!A.V = A = diag{à, u}. Adotando a mudança de variável 
z = Vn, a equação linearizada se escreve como 17 = An que fornece a solução 
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Figura 6.4: Plano de fase - sela 


final z(t) = Ve2in(0) para todo t > 0. Portanto, a solução 


| p(t) — Pe | = CO + (cpet yu; (6.35) 


q(t) — qe 


é válida para todo t > 0, onde as constantes Cà e€ Cp dependem exclusivamente 
das condições iniciais. A interpretação geométrica é simples. Deslocando-se 
os eixos coordenados (p,q) para o ponto de equilíbrio, a trajetória que passa 
por um ponto inicial qualquer é uma combinação linear variante no tempo 
dos dois autovetores de Ae. Se os autovalores forem iguais uma perturbação 
infinitesimal em A, faz com que eles se tornem diferentes. 


A partir da equação (6.35) nota-se que no decorrer do tempo os dois coeficientes 
et e ce" não mudam de sinal. Isto faz com que as partes das trajetórias situadas 
suficientemente afastadas ou suficientemente próximas do ponto de equilíbrio, sejam 
tangentes a cada um dos autovetores. O ponto de equilíbrio recebe as seguintes 
denominações especiais, dependendo dos sinais dos autovalores, a saber : nó estável 
quando ambos são negativos, nó instável quando ambos são positivos e sela quando 
um é negativo e outro é positivo. Para ilustrar o que foi dito, a Figura 6.3 mostra 
o plano de fase correspondente a um nó estável enquanto que a Figura 6.4 mostra 
o plano de fase correspondente a uma sela. Nas duas figuras, as linhas tracejadas 
indicam as direções definidas pelos autovetores. 


e Autovalores de 4, são complexos conjugados : Os autovalores e os 
autovetores são da forma o + jw e vs + juw, onde Ug E R? ev, € R?. Com a 
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Figura 6.5: Plano de fase - foco estável 


mudança de variável n = Vz obtemos n = An onde 


—W 0 


=Í = o o UJ 
Arsis | (6.36) 


Convertendo em coordenadas polares n = [rcos(q) rsen(9)|", simples substi- 
tuição permite verificar quer = ør e ġ = —w e, consequentemente, r(t) = etc 
3 B o 


(t) — pe ot | 
165] -(oetonto cana (ota cana, tem 


é válida para todo t 2 0, onde as constantes co e c, dependem exclusivamente 
das condições iniciais. Para interpretar geometricamente este resultado, deslo- 
camos os eixos coordenados (p, q) para o ponto de equilíbrio. N G NG cada 
ponto da trajetória é determinado por uma combinação linear variant 

tempo das partes real e imaginária dos autovetores de Ae. o 


A equaçã i inai 
: E Ç (6.37) deixa claro que os sinais dos coeficientes da combinação linear que 
efine as ri lódi 
e psp mudam de maneira periódica no decorrer do tempo. O efeito é 
e a a ° ~ o o ° ° 2 o e l 
le, à p rt E e cada condição inicial, as trajetórias circundam o ponto de equilíbrio 
ao se v intóti | 
erica nenhum comportamento assintótico. Neste caso. o ponto de ilíbri 
recebe as seguintes denominaçõ | a 
nações a depender da parte real dos autovalores : foco 


estável á i instá 
el quando ela é negativa, foco instável quando ela é positiva e centro quando 


ela é nula. A Figura 6.5 ilustra o plano de fase correspondente a um foco estável 


o ET NGS QUN RUN UG UNS ONDA O 


ERR À 
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Como já comentado anteriormente, as trajetórias correspondentes ao centro são 
fechadas, indicando que em relação ao tempo, a solução é periódica. 

Para um sistema não linear qualquer, o seu modelo linearizado, válido na vizi- 
nhança de um ponto de equilíbrio (pe, qe) se escreve na forma Z = Aez e, portanto, o 
seu comportamento local depende exclusivamente dos autovalores Xeude A, E R 
que permitem definir A = Au e O = —(A + u), dois parâmetros reais (mesmo que 
os autovalores sejam complexos conjugados) dados pelo determinante e pelo traço 
com sinal trocado de Ae, respectivamente. Desta forma, o polinômio característico 


de A, expresso como 


det (s1 = Ae) =2+05+A (6.38) 


permite a seguinte classificação de um determinado ponto de equilíbrio, a partir dos 
valores do par (©, A), a saber : 


e Se A <0 —> sela 
ə Se A > 0 e © > 0 duas situações são possíveis : 


— Se A < 02/4 — nó estável 
— Se A > 02/4 —> foco estável 


e Se A >Q e© <0 duas situações são possíveis : 


— Se A < 02/4 — nó instável 
— Se A > O?/4 > foco instável 


Tendo em mãos a matriz Ae, não há dificuldade em se obter a classificação do ponto 
de equilíbrio a ela associado, não sendo nem mesmo necessário o cálculo dos seus 
autovalores. Nota-se também que independentemente do seu tipo, a estabilidade 
do ponto de equilíbrio ocorre desde que O > 0 e A > 0. As bordas dessa regiao, 
definidas por = 0 (autovalores complexos conjugados com parte real nula) e 
A = 0 (um autovalor nulo e um negativo) caracterizam os chamados casos críticos 
de Lyapunov nos quais a equação linearizada não fornece informação suficiente para 
que se possa decidir se o ponto de equilíbrio é ou não estável. A conclusão final, a 
este respeito, requer uma aproximação que inclua outros termos da série de Taylor, 
fazendo com que a própria equação aproximada seja não linear. | 
Vale relembrar que o tipo de um determinado ponto de equilíbrio, leva a carac- 
terizar as trajetórias do plano de fase no seu entorno. Como isto é feito através 
de uma aproximação linear, se a partir de uma condição inicial qualquer (po, qo) 
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Figura 6.6: Pontos de equilíbrio 


toda a trajetória (p(t), q(t)) permanecer na vizinhança do ponto de equilíbri 
análise local é suficiente para descrever o comportamento do sistema Ep 
estudo. Porém, se a trajetória se afastar do ponto de equilíbrio, é necessário 
estudo global, isto é, que envolva outras regiões do plano de fase Bus ilust so 
aspecto, consideramos a seguinte equação diferencial de PRE o 


| q — g(p) (6.39) 
q: eg (6.40) 


a que É = 2 e = 1/2 caracterizam dois casos distintos a serem considerados 
a e onde 9(p) : R > R é uma função linear por partes dada na Figura 
D. Us pontos de equilíbrio são imediatamente obtidos pela intersecção do gráfico 


E q = g(p) m a reta q = —(1/8)p e também estão representados na mesma 
gura.. Para 8 = 2 os pontos de equilíbrio são “a”, “o” e 
Ge /2 existe apenas um ponto de equilíbrio “o”. Entretanto prolongando 
pares lineares de g(p) dois outros pontos de intersecção aparecem a a É m 
e “b*”. Esses pontos, pelos motivos que vamos discutir em ed são nd 


Ea Ro q 
pontos de equilíbrio virtuais. Linearizando em um ponto de equilíbrio genérico 
com coordenadas (pe, qe), obtemos 


6679) 
b” enquanto que para 


| 
Ae = dp 
É (6.41) 


(Pe,qe) 


Para 8 = 2 nos pontos de equilíbrio “a” e “p” 


REET as derivadas da funcã A 
idênticas e O =3eA=3 permitem identificá- ção g(p) são 


los como sendo dois focos estáveis. 


RR e 


NE 
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Figura 6.8: Plano de fase para 8 = 1/2 


Da mesma forma, o ponto de equilíbrio “o” com O = 1 e À = —1 é identificado 
como sendo uma sela. A Figura 6.7 mostra uma região do plano de fase que contém 
os três pontos de equilíbrio. Nota-se perfeitamente o ponto de equilíbrio do tipo sela 
na origem e os dois focos estáveis. A partir de condições iniciais, mesmo que muito 
próximas da origem, as trajetórias acabam terminando longe dela, pois são atraídas 
e terminam em um dos focos estáveis. 

Para 8 = 1/2 no único ponto de equilíbrio “o” temos O = —1/2 e A = 1/2, 
tratando-se, portanto, de um foco instável. A Figura 6.8 mostra uma região do 
plano de fase que contém a origem. Qualquer condição inicial próxima da origem 
faz com que as trajetórias se afastem mas não tendem para o infinito como seria 
esperado. Da mesma forma, condições iniciais situadas longe da origem não divergem 
mas definem trajetórias que tendem a se aproximar dela. Nota-se que, nesse plano 


FA 
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de fase, existe uma trajetória fechada estável, um ciclo limite estável, que é uma 
solução periódica atrativa da equação diferencial em estudo. A explicação desse 
comportamento está no dois pontos singulares virtuais a* e b* que são dois focos 
estáveis pois, para ambos, tem-se O = 3/2 e A = 3/2. Na região do plano de fase 
definida por p < —10, as trajetórias são determinadas como se o ponto a* fosse um 
ponto singular mas que jamais é atingido, pois não se situa dentro daquela região. 
O mesmo ocorre para a região p > 10 em relação ao ponto de equilíbrio virtual b*. 
Finalmente, deve ser ressaltado que essas duas figuras foram obtidas por inte- 
gração numérica das equações diferenciais correspondentes. Este procedimento é, 
nos dias de hoje, bastante viável tendo em vista as mais variadas rotinas disponíveis 


que são particularmente precisas e eficientes para o tratamento e manipulação desse 
tipo de problema. 


6.3.1 Soluções Periódicas 


Nesta seção, vamos estudar equações diferenciais não lineares que admitem solu- 
ções periódicas. No plano de fase, o objetivo é determinar condições para que uma 
trajetória fechada, denominada ciclo limite possa existir. Esse problema foi objeto 
de inúmeros estudos que produziram diversos resultados importantes. Em seguida, 
vamos discutir dois deles que foram escolhidos por serem os mais gerais e por terem 
promovido grandes impactos na teoria de equações diferenciais. Antes, porém, pre- 
cisamos recordar algumas propriedades de funções de duas variáveis. No plano (p, q) 
um domínio é dito simplesmente conexo se tiver uma geometria bastante simples 
sem “buracos”. Seja D uma região deste plano. Se D contiver toda curva simples 


(sem nenhum cruzamento) fechada, inclusive o seu interior então D é simplesmente 
Conexo. 


Teorema 6.2 (Teorema de Green) Seja C uma curva simples fechada em um 


domínio simplesmente conero D. Se P(p,q) e Q(p,q) são funções contínuas com 
derivadas parciais contínuas em D, então 


$ Pdp + Qda = / i (2 , o) doda (6.49) 


onde R = intC é a região delimitada por C, ou seja, o seu interior. 


| O Teorema de Green permite concluir um outro resultado importante que está 
ligado à independência do caminho de integração. Para R = int0 C D, a condição 
oq)  ƏP 
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implica em que a integral no lado esquerdo de (6.42) não depende do caminho de 


integração e vale 


$ Pisk Oir=N (6.44) 
G 


isto é, se a igualdade (6.43) vale para uma região simplesmente conexa ft então 
qualquer curva fechada C cujo interior se situa inteiramente dentro de R fará com 
que (6.44) se verifique. Embora bastante geral, existe uma situação importante no 
nosso contexto em que o Teorema de Green não se aplica diretamente. Imagine um 
domínio R onde as funções P, Q ou suas derivadas parciais não existam ou não 
sejam contínuas em N pontos isolados p1,:--,pn de R. Ainda assim, desejamos 
determinar o valor da integral de linha (6.43), onde C é uma curva simples fechada 
com todos estes pontos no seu interior. Neste caso, vale a igualdade 


N 
A Pdp + Qdg = E) Pdp + Qdg (6.45) 
C i=1 "0% | 


onde C; é uma curva simples contendo apenas o ponto p; no seu interior, para todo 
i=1,::-,N. O ponto relevante a ser ressaltado é que as integrais de linha do lado 
direito de (6.45) não dependem das curvas fechadas Ci, desde que sejam escolhidas 
simples. Neste sentido, são independentes do caminho de integração. 


Exemplo 6.9 Considere a integral de linha 


$ —qdp + pdq 
C 


J = 
p2 + q? 


onde C é uma circunferência de raio r com centro na origem. Como as funções P e Q não 
são contínuas na origem, o Teorema de Green não pode ser usado diretamente. Entretanto, 


escrevendo a mesma integral na forma 
1 
TE T) —qdp + pdq 
"JG 


podemos, agora, aplicá-lo para obter 
2 

J = — | | dpdq 
r2 R 
27 


onde a integral dupla é igual à área do círculo definido por C. Como era esperado, o 
valor dessa integral não depende do raio da circunferência r pois ela é uma curva simples. 
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Ademais, se a ori à 
gem não estiver no interior da curva C, o Teorema de Green se aplica e 


devido à igualdade 
OQ OP q -p 
O OT Y(p,q) E R 


o valor da integral é sempre nulo, novamente para toda curva C simples assim escolhida. 


A mesma integral pode ser calculada de maneira diversa a ser utilizada mais adiante. 


De fato, com a mudança de variável te(9) = q/p verificamos por simples diferenciação que 


Jo — TIP + pda 
pig 


J= [ao 


é igual a variação angular sobre a curva fechada C. Se a origem não estiver no seu interior 
então J = 0. Por outro lado, se a origem estiver no seu interior, o fato de C ser fechada e 


simples faz com que J = 2r. Em ambos os casos, obtemos novamente os mesmos resultados 
anteriores. O 


e consequentemente 


O teorema dado a seguir aplica-se à equação diferencial de segunda ordem ex- 
pressa na sua representação de estado (6.28)-(6.29). Sua importância está rela- 
cionada ao fato de que ele é uma boa ferramenta para determinar regiões do plano 
de fase nas quais não podem existir trajetórias fechadas. 


Teorema 6.3 (Teorema de Bendixson) Se a função Of (p,9)/0q é continua mas 
não é identicamente nula nem muda de sinal em um domínio simplesmente conexo 
D, então não existem trajetórias fechadas no interior de D. 


A prova do Teorema de Bendixson é simples e é feita por contradição. Suponha 


que exista uma trajetória fechada T no interior de D. Como assumimos que IĮ seja 
uma trajetória, ela satisfaz a equação 


$ qdq + f(p,q)dp = 0 (6.46) 


Porém, por outro lado, como supõe-se que [ seja fechada, podemos aplicar o Teorema 
de Green para obter 


da + ;g)d — of 
fenda = f| fa 
= 0 (6.47) 
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Figura 6.9: Interpretação geométrica do índice de Poincaré 


onde a última relação decorre do fato de intr C D e da função 9f(p,q)/Og ser não 
nula e de sinal invariante nessa mesma região do plano de fase. A contradição se 
estabelece, reduzindo ao absurdo a hipótese de que existiria uma trajetória fechada 
em D. Para se ter uma ideia da precisão desse resultado, vamos aplicá-lo ao caso 
linear em que f(p,q) = ap + 89. Como 9f(p,q)/0q = 8, o Teorema de Bendixson 
assegura que se 5 + 0, então a equação linear y + By + ay = O não admite nenhuma 
solução periódica. De fato, essa equação só admite soluções periódicas quando a 
origem for um ponto de equilíbrio do tipo centro o que só pode ocorrer com p = 0 e 
a > 0. Fisicamente, o termo y representa perda de energia através, por exemplo, 
da ação de forças de atrito as quais, se diferente de zero, não permitem a ocorrência 
de soluções periódicas. 

Estamos em posição para introduzir uma das maiores contribuições teóricas para 
o estudo de existência de soluções periódicas de equações diferenciais não lineares. 
Considere a equação diferencial de segunda ordem na sua representação de estado 
(6.28)-(6.29) e seja C uma curva simples fechada no interior de um domínio simples- 
mente conexo do seu plano de fase. O índice de Poincaré de C é dado por 


lo = Ê de(p, q) (6.48) 


onde tg(0(p,q)) = — f (p, q)/q, sendo que a sua interpretação geométrica é feita com o 
auxílio da Figura 6.9. A curva C escolhida está em linha contínua e uma trajetória [I 
da equação diferencial é mostrada em linha tracejada. Neste caso, I’ é representada 
como sendo uma curva fechada mas tal requisito não é necessário. Note, porém, 
que Č deve ser uma curva simples e obrigatoriamente fechada. Considere um ponto 
com coordenadas (p,q) de C que também pertence a uma trajetória T. Como, 
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alternativamente, temos que tg(9(p, q)) = q/p = dq/dp, então 0(p, q) é o ângulo que 
a reta tangente à trajetória [', no ponto em consideração, faz com a horizontal, isto 
é, com a abscissa p do plano de fase. 

Assim sendo, não é preciso cálculo algum para se concluir que o índice de Poincaré 
de qualquer trajetória fechada T seja dado por 


I =1 (6.49) 


De fato, fazendo C coincidir com PI a integral de linha é igual à integral do ângulo 
tangente a I’ e como, por hipótese, C =T é uma curva simples a soma total corres- 
pondente a uma volta completa é igual a 27. Para qualquer outra curva fechada 
€ escolhida, é preciso calcular a integral de linha indicada em (6.48). Com esse 
propósito, por simples diferenciação verificamos que 


fdq — qdf 
dð = —=— 6.50 
r id 
bem cana i 
| df = Dedo + sdg (6.51) 


onde, para simplificar a notação, não estamos explicitando a dependência das funções 
e dos diferenciais envolvidos com as variáveis independentes p,q. Assim sendo, o 
índice de Poincaré pode ser calculado através da integral de linha 


1 | 
der T Pdp + Qdq (6.52) 
AI E 
onde as funções indicadas são dadas por 


q of 


ED SS f q Of 
q? + f? ap’ 


ed ESO 
A primeira conclusão importante é que às funções P e Q não são contínuas nos 
pontos do plano de fase tais que q? + f (p,q)? = 0, isto é, nos pontos com coordenadas 


Q= (6.53) 


“tais que q = 0 e f(p,0) = 0. Ou seja, as funções P e Q deixam de ser contínuas 


apenas em todos os pontos de equilíbrio da equação diferencial em estudo. Podemos 
também verificar por simples derivação que OP/ðq = 0Q/0p e que estas derivadas 
parciais deixam de ser contínuas naqueles mesmos pontos. Assumindo que os pontos 
de equilíbrio p1,'*: » pn sejam isolados, com os resultados anteriores, em particular 
com a igualdade (6.45), podemos concluir que: 
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e Se não existir nenhum ponto de equilíbrio no interior de C, então Ig = 0. 
e Se o mesmo ponto de equilíbrio estiver no interior de C e de C”, então Ic = Io. 


e Se os pontos de equilíbrio p1,p2,:-- estiverem no interior de €, então lc = 
>; Ic,, onde C; é qualquer curva simples fechada contendo apenas o ponto de 
equilíbrio p; no seu interior. 


Isso mostra que o índice de Poincaré não é uma propriedade intrínseca da curva 
escolhida mas sim dos pontos de equilíbrio da equação diferencial que se encontram 
no seu interior. Desta forma, para calcularmos Ic podemos escolher uma outra curva 
simples e fechada C”, porém, situada arbitrariamente próxima de um determinado 
ponto de equilíbrio com coordenadas (pe,qe) e fazer o cálculo da integral de linha 
para a aproximação linear f(p,q) = a(p — pe) + B(qg — qe) em que a = df/0p e 
8 = ðf /ðq, ambas calculadas em (pe, ge). Observe que, sem perda de generalidade, 
para cada ponto de equilíbrio podemos adotar (pe,qe) = (0,0) que corresponde a 
transladar a origem dos eixos coordenados exatamente para o ponto de equilíbrio em 
consideração. Assim sendo, na vizinhança de cada ponto de equilíbrio a aproximação 
linear se escreve £ = Aez, em que 


A= | Ro | (6.54) 
sit vô 
Fazendo f = ap + pq nas equações anteriores, notamos que 
+P = g+ (lap+t pba 
= Íp JEZIL (6.55) 


supondo que det(A) Æ O pois caso contrário o ponto de equilíbrio da aproximação 
linear não seria isolado, podemos escolher C” definida pela equação EA 
onde r > 0 é arbitrário. Com (6.55), sabemos que C” é uma elipse, portanto, uma 
curva simples fechada. O índice de Poincaré para qualquer curva simples fechada 
que envolva o ponto de equilíbrio é 


Q 
loe = 3 h —qdp + pdq 
TT 
det(A El / duda 
into” 
a 


= E (6.56) 
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Desta f ini 

ii S C envolve um unico ponto de equilíbrio, então o seu índice deve ser 

bo sp a epender exclusivamente do sinal de det(4.) = a = ð f/p calculad 
ponto de equilíbrio p = p.. Com a classificação já apresentada, concluímos u 


e Se º P a 2 Ed 
o ponto de equilíbrio é um no, um foco ou um centro. então Tol 
3 c o 
e Se o ponto de equilíbrio é uma sela, então Jo = —1 


ois imei A 
Pois no primeiro caso todos eles são caracterizados por A = det(4.) > 0 en 
g O 


segundo caso por A = 
a p det(Ãe) < 0. Uma observação importante é que o índice de 
ao se altera se o nó ou foco for estável ou instável 


D rd bu 
e fato, supondo que uma trajetória fechada T exista, o seu índice é dps 


Fazendo C =T N 
e levando em conta que fo =35.. Ic; para os pontos de equilíbrio no 


rtir deste teorema, algumas conclusões 


Exemplo 6.10 Uma equação diferencial não 
mico de um sistema isolado contendo 
representação de estado 


linear que descreve o comportamento diná- 
presas e predadores é dada na forma da seguinte 


a de presas aumentaria segundo as taxas q e Bb 
? 


Pi => a| d 


po => Ag = | : a 
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Figura 6.10: Plano de fase do sistema presa-predador 


Portanto, pı é uma sela com Ic, = —1 e po é um centro com Ic, = 1. À partir do Teorema 
6.4, concluímos que se existir um ciclo limite ele deve, necessariamente, conter p2 e não 
conter pı no seu interior. A Figura 6.10 mostra o primeiro quadrante, ou seja p > 0,q È 0, 
do plano de fase da equação diferencial em estudo, tendo sido adotados os seguintes valores 
numéricos a = 0,5; 8 = 2,0 e y = 1,0. Notam-se os pontos de equilíbrio situados na origem 
do sistema de coordenadas e na posição (2:0,5). A partir de condições iniciais situadas na 
reta q = p/4 entre os dois pontos de equilíbrio, as respectivas trajetórias foram determinadas 
por integração numérica. Como atestam os índices de Poincaré já calculados, cada trajetória 
fechada (que são diversas) tem apenas o segundo ponto de equilíbrio no seu interior. m 


Devem-se ressaltar dois aspectos importantes relativos aos Teoremas 6.3 e 6.4. 
Em primeiro lugar eles podem ser aplicados a sistemas de segunda ordem genéricos, 
isto é, não se aplicam apenas a casos particulares específicos. Em segundo lugar, 
ambos não determinam exatamente as trajetórias fechadas porventura existentes 
mas estabelecem regiões onde elas podem ou certamente não podem existir. 


6.4 Estabilidade 


O estudo de estabilidade de equações diferenciais é básico e importante pois ca- 
racteriza o comportamento temporal das soluções, decorridos um intervalo de tempo 
arbitrário. Ou seja, estuda-se o comportamento das soluções quando a variável 
independente, o tempo t > 0, tende para infinito. Para a equação diferencial não 
linear (6.7), é claro que os pontos de equilíbrio são centrais no estudo de estabilidade. 
Um ponto de equilíbrio x. E€ R” é assintoticamente estável se existir uma vizinhança 
D(xe.), na qual toda condição inicial xo € R” a ela pertencente, gera uma solução 
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x(t, xo) E€ D(ze) para todo t > 0 e que tende para x, no decorrer do tempo, ou seja 
lim;-oo L(t, £0) = Le. À vizinhança D(x.) é chamada domínio de estabilidade. Um 
ponto de equilíbrio pode ser instável, quando então condições iniciais mesmo muito 
próximas fazem com que as soluções correspondentes x(t, xo) dele se afaste. 

Para as equações diferenciais lineares, a estabilidade assintótica é sempre um 
atributo global. Ou seja, um ponto de equilíbrio assintoticamente estável, que é 
necessariamente único, as soluções dele se aproximam não importa as condições 
iniciais consideradas. Da mesma forma, quando ele for instável, para toda condição 
inicial, as soluções dele se afastam. No caso de equações diferenciais não lineares com 
diversos pontos de equilíbrio, os domínios de estabilidade são locais, pois cada um 
deles pode conter apenas um único ponto de equilíbrio. Entretanto, como veremos 
mais adiante, existem equações diferenciais não lineares com um único ponto de 
equilíbrio assintoticamente estável e com domínio de estabilidade global. 

Como sabemos, as equações diferenciais não lineares ainda podem exibir um 
outro comportamento bastante interessante do ponto de vista de estabilidade. Trata- 
se do chamado ciclo limite, que é caracterizado por uma trajetória fechada no plano 
de fase ou, de forma equivalente, por uma solução periódica em relação ao tempo. 
Um ciclo limite pode ser estável quando, para um conjunto de condições iniciais, as 
trajetórias dele se aproximam ou instável, caso contrário. O estudo de estabilidade 
de ciclos limite, através de um método aproximado, é feito em seguida. 


6.4.1 Linearização Harmônica 


Aproximar e saber usar aproximações é uma arte. Muitos problemas se tornam 
mais simples para serem resolvidos quando se admite algum tipo de aproximação. 
A arte está em se chegar ao compromisso de simplificar mas, ao mesmo tempo, 
não descaracterizar o problema em estudo. Por exemplo, a aproximação 2º = 10 é 
grosseira mas ela fornece uma aproximação bastante razoável para log,9(2) = 1/3. 

Para funções de variáveis reais, uma estratégia simples e eficaz consiste em desen- 
volvê-la em série e, em seguida, considerar apenas um determinado número (finito) 
de termos. Duas séries são frequentemente adotadas, a saber, a série de Taylor e 
a de Fourier, as quais permitem obter aproximações bem conhecidas. Com a série 
de Taylor, obtemos a aproximação linear que já tivemos a oportunidade de estudar 
enquanto que, com a série de Fourier, obtemos a chamada linearização harmônica, 
que passamos a analisar com maiores detalhes. 

Dada uma função com domínio e contra-domínio reais g(e) : R > R, calculamos 
o seu valor u(t) = g(e(t)) para e(t) = a sen(wt), onde a > 0 é a sua amplitude e 
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u > 0 é a sua frequência. Reconhecemos imediatamente que u(t) é uma função com 
período T = 27 /w. Assumindo que 


/ ve u(t)dt = 0 (6.57) 


-r /w 
Sr] ] da 
na expansão de u(t) em série de Fourier, temos apenas os termos que dependem 
pe a l o 
frequência w e de seus múltiplos inteiros. Assim sendo, levando em conta apena 
primeiro termo, obtemos a aproximação 


u(t) = a sen(wt) + f cos(wt) (6.58) 
onde os coeficientes reais & e B, dados por 
TjW 

Ss / u(t) sen(wt)dt (6.59) 
© T J—rjw 

w [Me 6.60) 

Dooa = l u(t) cos(wt)dt (6. 

A J—r/w 


são os valores fornecidos pela série de Fourier. Ocorre um fato relevante, = nm 
A : endem 

u(t) uma função da forma u(t) = gla sen(wt)), os parâmetros a e 5 se epend E 

do valor da frequência w considerada. De fato, adotando a mudança de variav 


9 = wt, obtemos 


a = a J gla sen(0)) sen(o)do (6.61) 
Do e = [sta sen(0)) cos(9)dê (6.62) 


o que torna aparente que este dois coeficientes dependem exclusivamente da a 
g(:) em estudo. Não há dificuldades em determiná-los mesmo que, se — ; 
através da adoção de algum método numérico para etetuar as integrals o as a 
(6.61)-(6.62). Ademais, é importante ressaltar que O cálculo desses coe RR on 
requer praticamente nenhuma propriedade de g(-), basta que as integrais indic 


existam e sejam bem definidas. 


Definição 6.2 (Função descritiva) Seja gle) : R > R uma função de variável 
real. A função de variável complexa Lo(a) : a > 0 — C, dada por 


a+ 
Lg(a) = a E (6.63) 


é a função descritiva associada à função g(e). 
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Em seguida, daremos uma interpretação que torna relevante esta definição. No 
momento, desejamos torná-la operacional através do cálculo da função descritiva 
associada a algumas funções importantes no contexto de equações diferenciais não 
lineares. De imediato, ressaltamos que se g(:) for uma função ímpar, ou seja, que 
satisfaz gle) = —g(—e) para todo e € R, então 8 = 0 e, por consequência, a função 
descritiva a ela associada 


Lo(a) = pi 
EA 


: / atacando rssaO O (6.64) 


TA Jr 


é sempre real. Da mesma forma, para as funções ímpares, a igualdade (6.57) é 
sempre satisfeita. Este é um resultado bem conhecido, pois indica que, neste caso, 
o valor constante na série de Fourier é nulo. 


Exemplo 6.11 Para a função linear g(e) = ke com « E R, que é ímpar, aplicamos (6.64) 
para obter 


Lo = f sen? (0)dð 


Como era de se esperar, no caso linear, a função descritiva é constante e igual ao ganho da 
função original, ou seja, k = g(e)/e para todo e Æ 0. | o 


Exemplo 6.12 Uma função muito importante no estudo de sistemas de controle não 
lineares é a chamada função sinal ou relé ideal definida por 


m , e>o0 
gley -m e<0 


sendo que g(0) pode assumir qualquer valor no intervalo —m < g(0) < m. Trata-se de uma 
função ímpar mas que é descontínua em e = 0. Neste caso, a equação (6.64) fornece 


2 T 
L(a) = — m sen(0)d8 
Ta Jo 
= 4m 
= ra 
Observa-se que a função descritiva é estritamente decrescente em relação a a > 0. o 
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Exemplo 6.13 A função dada a seguir descreve o comportamento de um relé com zona 


morta. 


m , e>h 
g(e) = O , Jel <h 
-m , e<—h 


sendo que nos dois pontos de descontinuidade ela satisfaz -m < g(-h)<0e0<g(h)<m. 
Trata-se de uma função ímpar para a qual o cálculo indicado em (6.64) requer considerar 
duas situações distintas. Se a < h então Lg(a) = 0. Por outro lado, se a > h definindo 7 tal 


que a sen(7) = h, obtemos 


4 T/2 
L(a) = E m sen(0)d6 
4 
E cos(T) 
Ta 
h2 
Ta a 


a qual permite escrever a função descritiva na forma final 


0 , O0<a<h 
Lala) =) am SZ- , a>h 


ta? 
Essa função tem um comportamento interessante. Para a > h, obtemos a aproximação 
Lo(a) = 4m/ra que é a função descritiva do relé ideal. Ademais, simples derivação indica 
que Ly(a) atinge o valor máximo para a” = V2 h com Lg(a*) = 2m/mh. c 


Exemplo 6.14 A função dada a seguir descreve o comportamento de um ganho linear 
com saturação. Tem uma grande importância prática pois retém o comportamento estático 
de atuadores e sensores reais. 


m , e>h 
g(e) = ke , lel<h 
-m , e<—h 


Como pode ser notado, trata-se de uma função ímpar mas que é contínua apenas se kK = m /h. 
Novamente, o cálculo indicado em (6.64) requer o estudo de duas situações distintas. Se 
a < h então L;(a) = & pois sob esta condição a função pode ser considerada linear. Por 
outro lado, para a > h definindo a sen(r) = h, obtemos 


T m/2 
Lila) = E ka sen? (0) dO + m sen(0)d8 
7 na O T 


4 (5 ka sen(27) ae cos(7) } 


mra |2 — 4 
— t {2kar — 2Kh cos(T) + 4m cos(T)} 
Ta 
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0 LD kaa- PELES. mma $ e RE PO À é A ira mi an a, 


O 05 41 145 2 25 3 45 4 as S Figura 6.12: Histerese 


g(a sen(0)) 


Figura 6.11: Funções descritivas 


de tal forma que a função descritiva procurada é 


pia K z O<a<h 
gA 2e sent (h/a) + Eh Va -Rh , a>h 


T Ta? 


É claro que para s = 0 e h — 0, obtemos a função descritiva do relé com zona morta e a 
do relé ideal, respectivamente. No caso geral, para a > h, a partir de sen” t (h/a) = h/a, 
obtemos à aproximação Lg(a) = 2kh/ma+(4m—2kh)/ta = 4m/ra, que é a função descritiva 


Figura 6.13: Resposta correspondente a uma entrada específica 


do relé ideal. A Figura 6.11 mostra as funções descritivas do relé ideal (a), do relé com | bem como 
zona morta (b) e do ganho com saturação (c). Em todos os casos adotamos os valores 5 T T 
normalizados m = h = k = 1. Confirma-se, como esperado, que quando a amplitude a > 0 6 = > À | (—m) cos(T)dT + / (m) cos(r)dr } 
se torna suficientemente grande em comparação com h = 1, os três gráficos coincidem. O | RAA < 
= a sen(7) 

? T 
Exemplo 6.15 A Figura 6.12 mostra uma relação típica de um fenômeno físico denomi- 4m ) 
nado histerese. Essa relação está presente em vários dispositivos eletrônicos ou mesmo na — “ma : 


modelagem de diversos elementos mecânicos constituídos por engrenagens, as quais, devido 
ao desgaste natural, apresentam folgas. Fazendo e = a sen(6) a respectiva função g(e) = 
g(a sen(0)) é mostrada na Figura 6.13 onde devemos colocar em evidência que a sen(T) = h 4m 

e que a > h pois, caso contrário, o efeito de histerese não é observado. A partir das equações To = Ta? 
(6.61) e (6.62) determinamos 


Diferentemente do ocorrido nos casos anteriores, a função descritiva associada à histerese 
é uma função complexa. O lugar geométrico de L,(a) no plano complexo, parte do ponto 


T T 
a = E r (=m) sen(r)dr +[ (m) sen(r)dr | L(h) = —j(4m/mh) e tende para a origem, tangenciando o eixo real, quando a — 00. E 
T 0 = ; 
ME cos(T) Agora que sabemos calculá-las, é necessário colocar em evidência a importância 
i das funções descritivas. Inicialmente, relembramos que dada uma função de trans- 
= -yp | ferência de um sistema linear invariante no tempo à = H(s)ê, os valores H(jw) € C 


Ta 
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ut) = a H (jw)|sen (wt + ZH(jw)) 
a Re(H(jw))sen(wt) + a Im (H (jw)) cos(wt) (6.65) 


Il 


a qual, comparada com (6.58) i ; 
E E T .90), permite aplicar (6.63) e determinar a funcã ms 
associada à função de transferência H (s) como a A ESE 


Ene aRe(H(juw)) + jalm(H(jw)) 


H(jw) (6.66) 


Il 


I l 
o que E aplicar exatamente o mesmo conceito e determinar à função 

critiva associada a qualquer função de transferênci í 

y sferência estável. Em (6.66 

a notação Ly(w) para evidenciar | dna 

- que ela depende de w € R e não de 

à ende d 

devido ao fato da relação entre a entrada e e a saída u ser linear / po 
vemos em (6.65), a saída u(t) e a entrada e(t) 
frequência de oscilação w E R. 


No caso não linear 
para e(t) = a sen(wt), a saída será | 
| i ines | t) = glas t 
é uma função periódica cuja séri ja e 
Ja série de Fourier a 
e de seus múltiplos. Ras 


é Ademais, como 
são funções diversas mas têm a mesma 


dependem d 
a € ew 
A ; ra manter a mesma interpretação dada há pouco para os 
mp s, a função descritiva foi definida de tal forma a aproximar a saíd 
E saída 
pelos termos que dependem apenas de w € R, descartando os demais 


` P 
correspondente à entrada e(t) = a sen(wt) a saída aproximada será isa 


u(t) = alLg(a)|sen (wt + £La(a)) (6.67) 


Isso toi na ap q 
ar e e ue, No mundo da tr ansformada de Laplace, a função descritiva 
Lola deve ser nterpretada como uma f a ere t 
a P p t i C unçao de transf rência cuja resposta em 
regime permanente senoida fornece a l ime h 
aproximaçao de pr l Ôni Í 
E l primeira harmônica da saída 
A se uir, veremos que a aproximação de imei e | 
z : q p Imaç primeira harmônica é uma ferramenta 
Importante para o e e e ili e de e e feren 
i & studo d stabilidad d quaçoes difere ciais, em particular 
nd o p o 
para O es udo de estabilidade de soluções petr iódicas através do critério de N ai 


O chamado Mé mei 
é A . e 
todo da Primeira Harmônica aplica-se a equações diferenciais que 
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Figura 6.14: Diagrama de blocos 


exibem uma estrutura do tipo Lur'e, na sua forma mais geral, dada por 


sa AE (6.68) 
n Ge (6.69) 
A ape (6.70) 
aa (6.71) 


onde x € R? é o vetor de estado, u € R é a variável de entrada, y E R é a 
variável de saída e r € R é a referência. A função g(e): R > R define a parte 
não linear. Geralmente, ou após uma mudança de variáveis conveniente, adota-se 
r = 0 como referência. Como frequentemente a função g(e) é ímpar, verificamos 
que u = gle) = g(—y) = —g(y), quando então obtemos a forma de Lur'e dada 
pelas equações (6.22)-(6.24). Denominando H(s) = C(sI— A)™*B + D, a função de 
transferência da parte linear ĝ = H(s)ú, ao adotarmos a aproximação de primeira 
harmônica para a parte não linear, obtemos o diagrama de blocos da Figura 6.14 
após a função g(e) ter sido substituída pela sua função descritiva. 

Sabemos que a estabilidade diagrama de blocos da Figura 6.14, que depende 
da localização das raízes da equação característica | + Lo(a)H(s) = 0, pode ser 
estudada com o auxílio do critério de Nyquist. Considerando a > 0 fixo, o ponto 
crítico —Lo(a)”! € C está definido. O mapeamento da curva fechada C, que en- 
volve o semiplano direito complexo e que depende exclusivamente de H (jw) para 
w € R, permite concluir a respeito da estabilidade. Entretanto, como a > 0 
não é um valor conhecido, determinamos o lugar geométrico dos pontos críticos, 
a saber Tala q a > 0, que é uma curva a ser desenhada no plano complexo 
Re(H(jw)) x Im(H(jw)), denominada lugar crítico. Neste plano, são particular- 
mente importantes os pontos nos quais as duas curvas se cruzam, isto é (ae, we) 
tais que —Lo(a0) ! = H(jwe). A consequência é que |Lg(a)|HQuwe)| = 1 e 
ZL(ac)+ LH (jwe) = —7. Portanto, admitindo o sinal de referência nulo, a hipótese 
de existir uma saída da forma y(t) = ae sen(wet + 6) é consistente com o diagrama 


f 
f 
t 
É 
| 
i 
É 
À 
E 
E 
i 
E 
li 
É 
E 
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de blocos da Figura 6.14 pois 


y(t) = ac|Lglac)||H(Jwe)| sen (wet + ọ + LLlac) + LH (jwe) + z) 


= Ge sen (wet + $) (6.72) 


Em outras palavras, a função senoidal y(t) com período Te = 2r /we é uma solução 
periódica aproximada da equação diferencial não linear em estudo. O ponto de 
cruzamento não permite determinar a defasagem à, a qual, nos cálculos feitos, é 
arbitrária. O critério de Nyquist, como acabamos de expor e dentro das limitações 
introduzidas pela aproximação adotada, permite verificar se esta solução constitui 
uma trajetória fechada estável, ou seja, um ciclo limite estável. A partir de um 
conjunto de condições iniciais, as trajetórias tendem para a trajetória fechada estável 
e o sistema oscila indefinidamente. 

É muito relevante verificar quando podemos esperar resultados precisos do méto- 
do da primeira harmônica que acabamos de expor. Neste sentido, é importante 
notar que a validade deste método não depende exclusivamente da aproximação 
introduzida pela função descritiva. Do diagrama de blocos da Figura 6.14, fica claro 
que Li()H (jw) deve ser uma boa aproximação para a resposta em frequência do 
operador não linear y(t) = h(t) + g(e(t)) onde h(t) = £L-!(H(s)). Mesmo que L(a) 
não seja uma boa aproximação para u = g(e) a aproximação anterior pode ser muito 
boa, desde que 


HG) <1,Vw> we | (6.73) 


fazendo com que os erros cometidos pela função descritiva, ao desprezar as demais 
harmônicas, sejam atenuados pela função de transferência da parte linear H(s). É 
interessante notar que isso geralmente ocorre tendo em vista que é comum H (s) ter 
polos em número maior do que de zeros. 

Vamos ilustrar esses resultados com dois exemplos. O primeiro é uma equação 
diferencial que pode ser colocada na forma do diagrama de blocos da Figura 6.14 com 
g(e) sendo uma histerese como da Figura 6.12 definida pelos valores normalizados 
m = h = 1, referência nula e 

1 


A aen (6.74) 


Com L(a), determinamos 


—Lo(a)”! — EEE a2 — h2 srs (6.75) 
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p a i aasa 
um 


Figura 6.15: Mapeamento e lugar crítico 


de tal forma que o lugar geométrico dos pontos críticos, segundo a pen fan E 
é uma reta paralela ao eixo real, tendo em vista que a parte sa E at 
depende da amplitude a 2 1. A Figura 6.19 mostra O lugar crítico em | a gi a = 
e o mapeamento da curva fechada C que envolve o posa lirei E o 
mantém o polo s = O no seu exterior através de uma semicircunterencia ae a 
arbitrariamente pequeno. Apenas as partes desse mapeamento ama ri 
H(jw) para todo w | 0 € R são mostradas em linha contínua. Nota-se 7 A 
mapeamento é fechado à direita por uma semicircunferência e raio o o O 
grande, fruto do cálculo de H(s) = 1/s com s = ee! E para todo p € ; E de 
ponto onde as duas curvas se cruzam, denotado por “P”, é determinado 


se Lola) |! = H(jwe) ou seja 


W + we = 4/7, Ge = 1 +w? (6.76) 


; : o | 
Essa equação de terceira ordem admite apenas uma ralz real tdo = 0,7866 a gs 
determinamos ac = 1,2723. Passamos agora à aplicar o critério de estabilida r 
Nyquist no pontos “A” e “B” respectivamente. Como os dois polos de H (s) estão 


localizados fora de C, então Np = 0. 
ə Ponto “A”- Claramente Nerit = 1 implica que N; = 1 indicando instabili- 
[4 23 
dade. Em consequência, a amplitude a cresce e o ponto « A” se desloca para O 
ponto “P”. 
e Ponto “B”- Nessa situação, Neri = 0 e portanto N i i que o 
estabilidade. Assim sendo, a amplitude a decresce e o ponto B” também s 


desloca na direção do ponto “P”. 
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Figura 6.16: Simulação no tempo e plano de fase 


Desta form 
a . Es 
a a Pb a da aproximação adotada, o critério de Nyquist 
onto eine um ciclo limi í ; 
imite estável cuja primei Ani 
. Š imeira harmô f 

as aproximações y(t) x Ng nica fornece 
A so A ac sen(w. t+ o). Essas diversas aproximações, que diferem 
Ra p : bela detasagem à, constante, são válidas. Cada uma pode ser a mai 

a a depender das condições iniciais adotadas. Comr=0.ea i 

EA 


de estado (6.68)-(6.71), escrita na forma representação 
os (6.77) 
A E (6.78) 
Yy =P (6.79) 
Dne (6.80) 


a aproximação de primeira harmônica p(t) = y(t) 
Wcae Cos(wet + &) de tal forma que, no plano de 
a mesma elipse 


permite calcular q(t) = p(t) = 
fase, todas as aproximações definem 


2 q i 
i EES 


cuja e ão nã 
Ja equação não depende da defasagem &. Neste sentido, concluímos que o método 


da prim Ira h S ] S ] 
i e nica mals ad quado para rificar a XIS encia d rminar um 


| A Figura 6.16 ilustra aquilo que já foi 
jadas, temos duas soluções da equação e 
to = [5 5). Em linha contínua, mostra, 
y(t) com & = 0. Verifica- 


dito. No lado esquerdo, em linhas trace- 
m estudo a partir das condições iniciais 
stramos a aproximação de primeira, harmônica 
se que após um certo tempo, ambas as soluções tendem 
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para funções periódicas com as mesmas amplitude e frequência mas com defasagens 
nitidamente diferentes. Os valores para ae € we, fornecidos pelo método da primeira 
harmônica, são bastante precisos como é demonstrado no gráfico da direita. Nele 
vemos, em linhas tracejadas, quatro trajetórias correspondentes às condições iniciais 
to = [+5 + 5] que tendem para uma curva fechada, cuja aproximação de primeira 
harmônica, é a elipse (6.81) mostrada em linha contínua. A concordância, neste 
caso, é expressiva e indica o bom desempenho do método adotado. 

O segundo exemplo é a célebre equação de Van der Pol. Trata-se de uma equação 
de segunda ordem da forma 


y-u(1-y)y+y=0 Je 


sendo | > 0 um parâmetro dado. Com as variáveis de estado p = y e q = y verifi- 
camos que ela tem apenas um ponto de equilíbrio (pe, qe) = (0,0), cujo modelo linear 
2 = Az com z = [pq], válido em uma vizinhança desse ponto, é completamente 
definido pela matriz 
0 1 | 

af t] ess 
Isso permite concluir que a origem é um ponto de equilíbrio do tipo foco instável 
(0 < u < 2) ou nó (u > 2) instável e, portanto, qualquer curva fechada que a envolva 
tem índice de Poincaré igual a 1. Pelo Teorema (6.4), pode existir uma trajetória 
fechada envolvendo a origem o que caracteriza a existência de uma solução periódica 
para a equação de Van der Pol. 

A questão chave que se coloca é como escrevê-la na forma padrão definida pelas 
equações (6.68)-(6.71) as quais levam, com o método da primeira harmônica, ao 
diagrama de blocos da Figura 6.14. Ela pode ser respondida ao escrevermos (6.82) 
alternativamente como y — uy + y = ui, onde u = (—y)2/3. A transformada de 
Laplace da parte linear fornece 


us 
H(s) = = 6.84 
= (6.84) 
enquanto que r = 0 e e = —y permitem determinar a função não linear g(e) = e? /3. 


É relevante observar que g(e) é uma função ímpar e que H(s) é sempre instável 
tendo em vista que u > 0. A relação (6.64) se aplica e determina a função descritiva 
associada a g(e), ou seja 


Lola) = — | sen“(0)do 


aaa A (6.85) 
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Figura 6.17: Mapeamento e lugar crítico 


fazendo com que o lugar crítico —Lo(a)! = — 


2 ° o 
= —4/a” seja real, negativo e válido para 


tod 
a O ponto de cruzamento entre H (jw) e o lugar crítico é calculado sem 
E es sendo we = 1 e ac = 2, e são independentes do parâmetro u > 0. 
m o : pr em linha contínua o mapeamento da função de transferência 
em (6. para todo s € C onde Č é a curva fech 
| ja é a da que envol 
semiplano direito complexo. Na mesm ] DER pe 
l a figura, a linha tracejada, indi i 
| o SARA | ejada, indica o respectiv 
pe pás e P é o ponto onde ocorre o cruzamento. Como os dois o 
s) estão localizados dentro de C, então N, = 2. Passamos a aplicar o critério de 


estabilidade de Nyquist no pontos “A” 
| Ss “A” e “B” E 
do ponto P p e “B” para concluir a respeito da estabilidade 


e P 66 A9 
o A Como Nerit = 0, temos que N, = 2, o que indica instabilidade 
| a forma, a amplitude a cresce e o ponto “A” se desloca para o ponto «pr, 


e Ponto “5B”- 
Temos que Nerii = —2 e, portanto, N; = 0, o que indica 
DA 3 o 


estabilidade. A amplitude a d 
E y i ecresce e o “DN , 
direção do ponto “P”. a EAs oca 


Podem a r u pi 
dependên ii na anima que o ponto “P” define um ciclo limite estável cuja 
A Iy relação ao tempo é dada por y(t) = 2 sen(t + q), em que é é uma 
as, 7 i z , 
En a pio ce fase, qualquer função dessa classe é representada pela cir- 
a yf +y“ = 2º. Como a aproximação de primeira harmônica não depende 


arâ ao é 
parâmetro ela não é precisa. Para u = 5, o lado direito da Figura 6.18 mostra o 


lano de fas i\etóri i ; 
Aa a e com trajetórias em linhas tracejadas para diversas condições iniciais. A 
orla 7 4 7 a e 2 i 
J no centro da figura é o ciclo limite estável da equação de Van der Pol. Para 
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Figura 6.18: Simulação no tempo e plano de fase 


comparação, em linha contínua mostramos à circunferência correspondente à apro- 
ximação de primeira harmônica. Nota-se que à amplitude ac = 2 é bem próxima 
do valor real mas a frequência da oscilação we = 1 não é uma aproximação ade- 
quada. Esse ponto é confirmado pela simulação temporal colocada no lado esquerdo 
da mesma figura. Ela mostra a solução da equação de Van der Pol (6.82) a partir da 
condição inicial y(0) = 4 e y(0) = 2 em linha tracejada e a aproximação de primeira 
harmônica em linha contínua. Após o transitório, a solução exata torna-se periódica 
com amplitude a = de = 2 mas com uma frequência de oscilação w ¥ We/2. Ensaios 
numéricos mostram que a aproximação de primeira harmônica torna-se precisa no 
que diz respeito à frequência de oscilação para 0 < u < 1 sendo que a amplitude é 
corretamente estimada para todo u > 0. 

Esta seção termina com um alerta a respeito da método da primeira harmônica. 
Como foi dito de forma exaustiva, ele se baseia em uma aproximação. À aproximação 
de primeira harmônica que retém apenas O primeiro termo do desenvolvimento em 
série de Fourier da parte não linear da equação diferencial em estudo. Isso viabiliza 
a determinação de eventuais soluções periódicas, bem como à verificação de que elas 
representam ciclos limite estáveis ou instáveis. Trata-se de um método simples que 
pode ser adotado para verificar a existência de oscilações em sistemas dinâmicos não 
lineares. Porém, sendo uma aproximação, é preciso validar a solução obtida através 
de simulação temporal ou do traçado do plano de fase correspondente. 


6.4.2 Critério de Popov 


Passamos agora a estudar uma das mais interessantes construções matemáticas 
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que já foram desenvolvidas no âmbito do estudo de estabilidade de equações dife- 
renciais não lineares. Trata-se do critério de Popov que se aplica para equações 
diferenciais do tipo Lur'e. Uma característica interessante do critério de Popov é 
que ele, assim como o critério de Nyquist, é formulado no domínio da frequência. 
Entretanto, enquanto o primeiro tem a sua aplicação restrita aos sistemas dinâmicos 
lineares, o segundo é mais abrangente e se aplica aos sistemas não lineares da classe 
Lur'e. A seguir expomos uma maneira alternativa e bastante simples para provar 
o critério de Popov pois incorpora novos conhecimentos os quais, obviamente, não 
estavam disponíveis há meio século. O conceito de base é o de Passividade que 


“enunciamos e caracterizamos, em seguida, para sistemas dinâmicos multi-variáveis. 


Definição 6.3 (Passividade) Um sistema linear, com condições iniciais nulas, 
definido pelas equações de estado 


t = Axr+ Buy (6.86) 
y 


Cx + Dw (6.87) 


em que x E€ R” é passivo se a sua saída y(t) € R™ correspondente a qualquer entrada 
w(t) ER” definida para todo t > 0 for tal que 


/ i y(t) w(t)dt > 0 (6.88) 
O 


Observe que esta definição impõe que o número de entradas e o de saídas do 


sistema em questão sejam iguais para que o produto escalar indicado em (6.88) 
possa ser realizado. Ademais, se ela for satisfeita, então o mesmo ocorre para 


| i y(t) w(t)dt > 0 (6.89) 
O 


com T > 0 arbitrário pois, ao adotarmos w(t) = O para todo t > T a integral (6.88), 
torna-se igual àquela em (6.89). Quando a desigualdade (6.88) for satisfeita estrita- 
mente para toda w(t) Æ 0, o sistema é dito estritamente passivo. Considerando a 
“função de Lyapunov v(x) = x'Px em que P € R"*” é uma matriz simétrica definida 


positiva, ao impormos que a sua derivada em relação a uma trajetória arbitrária do 
sistema linear (6.86)-(6.87) satisfaça 


o(a(t)) < yE) wt) + wlty(t) (6.90) 
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obtemos 
o 1 
[noa > FO =O) 


SÜ (6.91) 


— — > 0 pois v(z) = x'Px > 0 
na sa = A ligo E a a sob Es condição, o sistema 
E EE gh a Uma consequência interessante de (6.90) é que para ser 
f de pn E sistema deve ser assintoticamente estável. De fato, como 
ppa aatisfeita. para toda função de entrada w(t), gn io a 
fado + > 0 notamos imediatamente que v(a(t)) = a(t) (A P A 7 A 

| dica ue todos os autovalores de AER devem se si nerv 
a i lexo. Mas passividade naturalmente requer mais do que esta an i 
a fio calculando a derivada em relação a uma. trajetória generica de 


(6.86)-(6.87) as seguintes manipulações algébricas 
ùf) — yw- wy = 4 Pe+ x Pi- y'w— wy 
— (Az+ Bw) Pz + x P(Azx + Bw) — 
(Ca + Dw)'w — w (Cx + Dw) 
TAPPA BBC | z | (6.99) 
| w B'P-C -D-D w 


de uma matriz P > 0 tal que 


| 


permitem concluir com (6.90) que a existencia 


ARAPA PB-C | ug (6.93) 
BPC sD 


; jon a 
é uma condição suficiente (na verdade ela também T ip ae i 
sistema linear invariante no tempo com T de es a o Re dd 
tritamente passivo. Essa desigualdade, que depende inearm d mi 
: j aualdade Matricial Linear! cuja solução e prin pais 

pero pa pace ienes detalhes no Apêndice A. Uma situação particular 

z E | 
a a q pe que D = 0. Neste caso, com um elemento nulo na di- 


a e e a ite à e se existir 
gonal principal, a desigualdad (6.93) não admite solução. Entretanto, se 
3 


P AP+PA<0, PB=C (pa 


“em Inglês : Linear Matrix Inequality (LMI) 
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ela admite solução desde que o sinal de menor seja substituído pelo de menor ou igual. 
Ou seja, (6.94) assegura que sistema linear invariante no tempo com representação 
de estado (4, B,C,0) é passivo. Embora tenhamos feito os cálculos para sistemas 
lineares com múltiplas entradas e múltiplas saídas (m > 1), o nosso maior interesse é 
tratar sistemas monovariáveis, isto é com apenas uma entrada e uma saída (m = 1), 
cuja função de transferência é uma função de variável complexa escalar. 

Neste ponto, uma pergunta natural a ser feita é se a função de transferência 
de um sistema passivo tem alguma propriedade que a caracterize. 


A resposta é 
afirmativa e está ligada à definição dada a seguir. 


Definição 6.4 (Positividade real) A função de variável complexa H(s):C —> C 
é positiva real se 


Re(H(jw)) > 0 , Vw ER (6.95) 


Ou seja, a resposta em frequência H(jw) de uma função positiva real se situa 
no lado direito do plano complexo, fazendo com que a variação total de sua fase 
para w € R não possa superar +7/2 radianos. Se a desigualdade (6.95) for satisfeita 
estritamente, a função de variável complexa é denominada estritamente positiva real. 


Calculando a transformada de Laplace de (6.86)-(6.87), obtemos y(s) = H(s)ú(s) 


onde a função de transferência entre a entrada w e a saída y é dada por 
H(is)=C(ll=Ar BAD (6.96) 


assumindo que ela tenha todos os seus polos no semiplano esquerdo complexo, e que 


o mesmo ocorra com “wW(s), aplicando a versão mais geral do Teorema de Parseval, 
obtemos 


| vwa = = [io incjujda 
JO T — 00 
- > — H(ju)pó(iio) Pdo 
- E f Re(H(ju))hô(iu)Pda (6.97) 
O 


onde utilizamos que 2Re(H(jw)) = H(jw) + H(—jw) e fW(gw)| = [W(—jw)| para 
todo w € R. Como w(t) é arbitrária, essa igualdade torna aparente que passividade 
e positividade real são conceitos idênticos. Apenas, a passividade estabelece uma 
propriedade entre a entrada w e a saída y no domínio do tempo enquanto que 
positividade real estabelece uma propriedade da função de transferência entre essas 
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| ênc] ividade ou 
duas grandezas, NO domínio da frequência. Cabe ainda registrar que aaa o 
a | ão 1 j erizados atraves 
positividade real são conceitos que são integral e precisamente caracterizados 
da existência de uma solução P > O de né ou o A 
içã ebre 
ão para formular um ce | 
Estamos, agora, em posiç | : 
iais não li - Considere uma 
estabilidade de equação diferenciais não lineares da classe Lur'e. C 
equação diferencial escrita na forma 


čt = Axr+ Bw Cio 
o. (6.99) 
M (6.100) 


l j ilíbrio. 
m que ¢(0) = 0, de forma a garantir que a origem t = O seja um ponto de a E e 
O a problema de estabilidade absoluta requer a pese ado 
| ia um ponto de equilibrio 

“es 4(-) de tal forma que a origem seja dir | | era 
pa estável, isto é, que toda solução satisfaça limy-+o0 r(t) p 
a | el, 
qualquer condição inicial «(0) e R”. 


T 6.5 Considere À €E RºX" uma matriz com todos os seus psp ad 
rema 6. C utor sd 
a no semiplano esquerdo complexo e que a função de a a 
C(sl AJiB+D seja estritamente positiva real. Para toda função : 
S penae 


tal que HO =0, SUY 0 (6.101) 


a origem z =Q é globalmente assintoticamente estável. 


l i j .93). 
Prova : Como H (s) é estritamente positiva real existe P >0 anna é a 
o v(x) = x Px como função de Lyapunov, identicamente a (6.92), 
derivada em relação a uma trajetória qualquer fornece 


(x) < 2yw 
< —2yġly) 
Z 0, Yz#0ER" (6.102) 


O 
o que prova O teorema proposto. 


5 A -) nã j conhe- 
Um aspecto relevante desse resultado é que a funçao o(-) não a ns o 
cida. Se a parte linear do sistema for passiva e O gráfico na apa rir 
| j l imeiro e terceiro quadrantes, 
sar pela origem e se situar no pr e tera eira 
sad global está assegurada. Uma funçao ê dita pertencer ao setor IO, | 
a 
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(y) 


| onde utilizamos a relação w = —¢(y). Calculando a derivada indicada, obtemos 


ey to) —2(w+ryjw = t'Pa +x Pi- (w+ nsy)'w-— w (w+ sy) 


(Ax + Bw)'Px + x'P(Ax + Bw) — 
—(w + (Cx + Dw) w — w (w + k(Cx + Dw)) 


/ 
2] AP+PA PB-C, x 
- |? Rot mise (la (6.105) 


a qual, devido a (6.103), implica que (6.104) é satisfeita, o que prova o teorema 


Figura 6.19: Função não linear no setor [0, | E 


proposto. 


Neste ponto, algumas considerações são importantes. A primeira delas reside no 


K > 0 se d0) =0e0 < dy)/y < k para todo 
(y)/y SK p y F 0 E€ Re, portanto, podemos fato de que G(s) ser estritamente positiva real é equivalente a 


afirmar que &(y) pertence a esse setor se e apenas se (A(y) — sy) d(y) < 0. O próximo 
teorema considera essa nova classe de não linearidades para o estudo de estabilida 1. 
global de (6.98)-(6.100). Não é necessário mencionar que, comparada com a liso - 
anterior, essa tenha maior sentido prático por considerar o ganho « > O finito : A 
Figura 6.19 ilustra uma função não linear pertencente ao setor [0, x]. 


Re(H(ju)) > -5 YwER (6.106) 
e, assim, a condição de estabilidade exige que o gráfico da resposta em frequência 
da parte linear se situe à direita da reta vertical que passa pelo ponto —1/x + 90 do 
plano complexo. Essa condição é, em geral, mais exigente que aquela que obtemos 
com o critério de Nyquist aplicado para o caso linear em que Q(y) = ky. Neste 
caso, como H(s) é assintoticamente estável, o mapeamento de H(s) de uma curva 
fechada que contém todo o semiplano direito complexo no seu interior, apenas não 
pode envolver o ponto crítico —1 /K + j0. Isto mostra, de forma intuitiva, o motivo 
pelo qual a famosa conjectura de Aizerman é falsa. Ou seja, se um sistema for 
estável para qualquer função linear pertencente a um setor, isto não assegura que 
ele permanecerá estável para qualquer função (linear ou não) pertencente ao mesmo 
setor. A segunda é simples, para k — oo o resultado do Teorema 6.6 se reduz ao 
do Teorema 6.5. Finalmente cabe informar que a condição de estabilidade (6.106) 
traduz o chamado critério do círculo que se degenera em um semiplano quando a 
borda inferior do setor é nula. O exemplo dado a seguir ilustra os resultados obtidos 
até este ponto. 


Teorema 6.6 Considere A € RºX” uma matriz com todos os seus autovalores lo- 
calizados no semiplano esquerdo complexo e que a função de transferência G (s) = 
KH(s)+I seja estritamente positiva real. Para toda função M():RSR PERENG. 
ao setor |0, s], a origem x = 0 é globalmente assintoticamente estável. 


Prova : Como por hipótese, a função de transferência G(s) = Cp (sI— A)! B+ D, 
com Cr E KC e Dę = I + KD é estritamente positiva real, sabemos que existe uma 
matriz simétrica P > O que satisfaz a desigualdade matricial linear 


AP+PA PB-C! 
BP-C. -D-D' <0 (6.103) 


Por outro lado, considerando v(x) = «'Px uma função de Lyapunov associada ao 
sistema, definido pelas equações (6.98)-(6.100), a observação fundamental é que não 
devemos impor que a sua derivada em relação ao tempo seja sempre negativa mas 
sim que ela seja negativa para toda função que pertença ao setor [0, <], isto é É 


Exemplo 6.16 Considere um sistema não linear cuja parte linear tem a seguinte função 

de transferência | rö 
S 

lia st + 6s? + 13824 14s + 6 

“com polos iguais a —1, —3,—1 +j. Trata-se, portanto, de uma função de transferência assin- 

toticamente estável mas que não é positiva real. A Figura 6.20 mostra o mapeamento da 

curva fechada C que envolve todo o semiplano direito complexo. A reta vertical tracejada 


v(x) <2(w + ry)w (6.10 


la 


EEN oe f 1 1 1 t 1 i A 
E) 0. 0.05 0 0.05 0,4 043 oz 02s 0.3 033 


Figura 6.20: Mapeamento da curva C 


cruza o eixo real no ponto —0,1066 + j0 enquanto que o mapeamento de C através de H(s) 
cruza o semieixo real negativo no ponto crítico —0,0576 + 90. Considerando d(y) = «ny, 
podemos aplicar o critério de Nyquist para concluir que o sistema permanece estável para 
todo «K € [0;17,36]. Para a estabilidade com ¢(-) não linear, verificamos que a condição 
(6.106) é atendida para ¢(-) pertencente ao setor |0; 9,38]. Como era de se esperar, no caso 
não linear, o setor assim determinado tende a ser menor. Entretanto, é preciso lembrar que 
o critério de Nyquist é uma condição necessária e suficiente enquanto que a condição (6.106) 
é apenas suficiente para assegurar a estabilidade assintótica global da origem. o 


À seguir apresentamos o célebre critério de Popov. Muito embora ele seja válido 
no caso geral, a prova aqui apresentada é restrita ao caso particular em que a função 
de transferência H(s) é estritamente própria ou seja D = 0. Neste caso, a prova é 
muito mais simples e contém todos os ingredientes que desejamos ressaltar sem que 
manipulações algébricas muito mais elaboradas sejam necessárias. Por outro lado, 


assumimos que a não linearidade &(:) pertence ao setor [0, x] e assim ela exibe a 
propriedade 


f pléjd > 0, Vy € R (6.107) 
0 


necessária para que a função de Lyapunov a ser considerada em seguida possa de- 
pender diretamente de ġ(-). Como se nota, esta condição já estava presente anteri- 
ormente e decorre do fato de &(:) pertencer ao setor [0, x]. 


Teorema 6.7 Considere A € R”*” uma matriz com todos os seus autovalores locali- 
zados no semiplano esquerdo complexo e que exista um escalar O > O de tal forma 
que a função de transferência Grols) = (x + 0s)H(s) + I seja estritamente positiva 
real. Para toda função ġ(-) : R —> R pertencente ao setor |0, s], a origem x = 0 é 
globalmente assintoticamente estável. 
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Prova : O ponto crucial é a adoção da função de Lyapunov 
y 
vc) = Prr 29 | p(E)dE (6.108) 
O 


com P > 0e6 > 0a determinar. Essa função é positiva para todo q +£ 0 e R” 
como consequência de P > 0 e de ġ(-) pertencer ao setor [0, x] o que faz a integral 
ser não negativa. Ademais, como y = Cx verifica-se imediatamente que v(0) = 0. 
Derivando-a em relação ao tempo obtemos 


| 


d Y dy 
x Px + x Pi + 20— | Eae) Era 
dy 0 dt 


— gPr+ x Pãi+ 200(y)y 
= (Ax + Bw) (Px — 0C'w) + (Pa — 6C'w) (Ax + Bw) (6.109) 


b(a) 


onde utilizamos as relações w = —¢(y) ey = Cz. Como sabemos, para que a origem 
seja globalmente assintoticamente estável devemos ter 


ú(x) < 2(w + ky)w (6.110) 
o que, a partir de (6.109), resulta equivalente a 


ùò(x)—2(w+kyjw = (At+ Bw) (Px — 0C'w) + (Px — 0C'w) (Ax + Bw) — 
—(w + KCr}'w — w (w + KCz) | 


lisas RE] H (6.111) 


| 


wW BPF = Cko — Do Ee D, wW 
em que Cko = KC +0CA e Do = 1+6CB. Assim sendo, se a função de transferência 
Geo = Cuo(sI — AJ! B + Do for estritamente positiva real existirá P > 0 tal que 
A'P+ PA PB — Cpg | ii (6.112) 
e, por conseguinte, a estabilidade assintótica global da origem se estabelece. Final- 


mente, utilizando a relação A(sI — A)! = -I + s(sI — AJ" !, obtemos 


(kC + 0CA)(sI — A) B + (I +0CB) 
(kC + 08C)(sI — A) !B+T 
(ns +05)H(s) +1T (6.113) 


El 


Il 


| 
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o que prova o teorema proposto. E 


E interessante observar que a condição de estabilidade proposta pelo Teorema 
6.7 não necessita do cálculo da função de Lypaunov, a qual, aliás, depende da função 
&(:) que pode não ser conhecida exatamente. De fato, apenas sabemos que se trata 
de uma função pertencente ao setor |0, x]. Desta forma, nosso interesse é determinar 
o maior valor possível de k que assegura a estabilidade global do sistema. Para 
isto, temos como variável de folga o valor de 0 > 0, que deve ser determinado com 
este objetivo em mente. “Tendo como base o Teorema 6.7, o célebre critério de 
estabilidade de Popov pode ser imediatamente enunciado. 


Corolário TA 
6.1 Considere A € R uma matriz com todos os seus autovalores 


localizados no semiplano esquerdo complexo. Se existir um escalar O > O de tal 
forma que E 


Re (G n e) Hj) > -— (6.114) 


para todo w € R, então para toda função d(:):R > R pertencente ao setor |0, k], a 
origem x = O é globalmente assintoticamente estável. 


A prova é imediata. Como «x > 0, a condição (6.114) impõe que a função de 
transferência Gyuo(s) seja positiva real. Esse resultado fornece uma condição de 
estabilidade que é menos conservadora que aquela do Teorema 6.6 pois ela s reduz 
à condição (6.106) fazendo-se 0 = 0. O critério de Popov tornou-se famoso por esse 
motivo e por ser de fácil aplicação. Desenvolvendo a expressão (6.114), verificamos 
sem dificuldades que ela pode ser escrita na forma equivalente | 


Re (H(jw)) — (5) w Im(H(jw)) > E (6.115) 

K K 
para todow € R. Se para todo w € R colocarmos na abscissa os valores de Re(H (jw) ) 
ena ordenada aqueles de wIm(H (jw)), obtemos uma curva que deve se situar abaixo 
da reta imposta pela condição (6.115). Afirmamos novamente que para H(s) dada 
muitos valores dos parâmetros «x > 0 e0 > 0 podem ser assim determinados. Pon 
o objetivo central deve ser de obter o maior valor possível para x > 0. Pela Nes 


sença do produto wIm(H(jw)) na ordenada, o diagrama de Popov que acabamos 


de definir difere do diagrama de Nyquist. Em particular, basta fazer w > 0 pois 
como T. = Re(H(jw)) e Im(H(—jw)) = —Im(H(jw)) o lado esquerdo 
de (6.115) não se altera mediante a substituição de w por —w. Observe que a reta 
(6.115) cruza a abscissa no ponto —1/« e cruza a ordenada no ponto 1/0. 
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-0.25 m e UI > POE EEE A EEE Ao suar EETA e Ea, 
-0.15 -0.1 -0.09 0 0.03 ou 048 ta 0a 03 0.33 


Figura 6.21: O critério de Popov 


Exemplo 6.17 Considere novamente o sistema não linear tratado no exemplo anterior, 
cuja parte linear tem a função de transferência 


ENE a E 
st + 683 + 1382 + 145 + 6 


Trata-se de uma função de transferência assintoticamente estável mas que não é positiva 
real. A Figura 6.21 mostra o diagrama de Popov como acabamos de definir. Visualmente 
notamos a grande diferença quando comparado com o diagrama de Nyquist dado na Figura 
6.20, para a mesma função de transferência. A reta vertical, correspondente a O = 0, cruza O 
eixo real no mesmo ponto —0,1066 + j0 determinado no exemplo anterior. Nesta condição, O 
maior valor K = 9,38 é obtido o que implica na estabilidade assintótica global para qualquer 
função d(:) pertencente ao setor [0; 9,38]. A reta em linha tracejada corresponde aos valores 
O = 1247 e k = 17,36. Nota-se que ela é tangente ao diagrama de Popov de tal forma 
a obter o menor valor possível para o valor de —1 /K definido pelo seu cruzamento com O 
eixo das abscissas. Assim obtemos o maior valor para K > 0 dado acima. Concluímos que 
pelo critério de Popov, a estabilidade assintótica global do sistema é assegurada para toda 
função q(:) pertencente ao setor [0; 17,36]. Ou seja, o critério de Popov recupera O valor 
anteriormente obtido com o critério de Nyquist para o caso particular em que &(:) é linear. 


Em outras palavras, para este exemplo vale a conjectura de Aizerman, a qual sabemos que 
E 


H(s) = 


é falsa em geral. 


Assim como o critério de Nyquist, o de Popov pertence à classe de critérios 
de estabilidade expressos no domínio da frequência. Por isto, é de certa maneira 
surpreendente que ele possa tratar sistemas não lineares. Muito embora não seja 
uma condição necessária e suficiente, mas sim apenas suficiente, já traz a segurança 
de que, se atendido, garante a estabilidade assintótica global do sistema em estudo. 
Ademais, inúmeros exemplos tratados com o critério de Popov atestam que ele não 
produz resultados excessivamente conservativos. Ao contrário, seu sucesso ao longo 
de várias décadas está baseado na sua construção teórica ímpar e na qualidade dos 


P= diag(pı, aa Di) com p; > 0 para todo i = l,- 
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resultados fornecidos. O critério de Po 


= pov também ermite a síntese 
ara si p ntese de controle 
p sistemas não lineares do tipo Lur’e conto! 


6.4.3 Critério de Persidiskii 


i O critério de estabilidade de Persidiskii relaciona- 
nao lineares que apresentam uma estrutura, especial 
novamente colocada aqui para facilitar a leitura. | 
cuja representação de estado é dada na forma 


i(t) = Ayet) (6.116) 


onde z(t) € R” e blz): R” Ss Rº é 4 

: é uma função não li 
apresentar as propriedades básicas (O) = 0 e: TP WE T E deve 
como y;(x;)x; > O para todo z +0€R”e E Ynlin)] bem 


se a uma classe de equações 
Já descrita anteriormente e 
Considere uma equação diferencial 


lim [o EdE = +00 (6.117) 


para todo à = 1... imeira impõ i 
, ,n. À primeira impõe que a origem seja o seu único ponto de 


equilíbrio. a seg E 
Eai geo restringe cada componente da função não linear a depender 
mente, da mesma compo 
? nente do vetor de e Ta dad 
stado, a t 
todas as suas erceira indica que 
componentes devem pertencer ao setor l0, 00) e a quarta é necessária 


para que a função de Lyapunov possa ser i 
construída a parti E . 
e forneça resultados de estabilidade Aal partir da não linearidade 1/(.) 


Teorema 6.8 Considere A € RºXn 


uma matriz com todos 
OS Seus E 
calizados no semiplano esquerdo co autovalores lo 


mplexo. Se existir uma matriz P > 0 tal que 
/ 
AP+PA<O, P diagonal (6.118) 


entao para toda função W(:): R” — R” que satisfa 


| z as condições acima descri 
origem x =Q do sistema não linear (6.116) ER 


é globalmente assintoticamente estável. 
Prova: O ponto central que permite 


provar este teo é r 
de Lyapunov da classe Persidiskii. rema é a escolha da função 


Como por hipótese existe uma matriz do tipo 


n que satisf. i 
de Lyapunov (6.118), adotamos a função de Lyapunov q Istaz a desigualdade 


oe) = 552» / bs (E)dE (6.119) 
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a qual, verificamos imediatamente, exibe as propriedades v(0) = 0 e v(x) > 0 para 
todo x £ 0 € R”. Por outro lado, a sua derivada temporal em relação a uma 
trajetória genérica de (6.116) satisfaz as desigualdades 


v(r) = > pihia: 
i=1 


= y(£) Pi + å Py(z) 

= y(x) (A'P + PAW(z) 

< O, Vi£0€eR? (6.120) 
a partir das quais a prova do teorema proposto se estabelece. O 


A condição de estabilidade de Persidiskii faz com que se tente determinar uma 
solução da desigualdade de Lyapunov A'P + PA < O que seja diagonal positiva. 
Como era de se esperar, para que um sistema possa ser estável para toda função 
não linear %(-) da classe considerada, é exigido mais do que simplesmente a matriz 
A € R?” ter todos os seus autovalores localizados no semiplano esquerdo complexo 
o que, como sabemos, assegura que a mesma desigualdade de Lyapunov seja satisfeita 
para P > 0 mas não necessariamente diagonal. É preciso deixar claro que o teorema 
anterior fornece apenas uma condição suficiente de estabilidade global a qual, em 
certos casos, pode ser bastante conservadora. 


Exemplo 6.18 Retomando o Exemplo 6.7, com a matriz 


Ú 1 


ia -g/l —bfmb? 


e y(x) = [sen(x1) £2], concluímos que a equação diferencial (6.116) rege o comportamento de 
um pêndulo simples que oscila em um ambiente com atrito viscoso. Note que (O) = O mas, 
obviamente, ela não satisfaz a condição Wi(x1)x, = sen(xı)xı > O para todo xı #0 E R. 
É imediato verificar que os dois autovalores de 4 € R?*2 estão localizados no semiplano 
esquerdo complexo, assegurando a existência de uma matriz P > O tal que A'P+PA<O. 
Entretanto, não existe uma matriz da forma P = diag(pı, p2) que satisfaça essa mesma 
desigualdade. De fato, ao efetuarmos os cálculos, notamos que o primeiro elemento da 
diagonal principal de 4'P + PA é nulo. Isso ocorre pois o mesmo acontece com a matriz A. 


Como no caso geral temos 
(A'P + PA)ii = 20i , NE 1, E 


uma condição necessária (mas não suficiente) para que a desigualdade de Lyapunov admita 


uma solução diagonal positiva é que todos os elementos da diagonal principal de A ER? 


sejam estritamente negativos. m 
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Uma observação que se pode fazer a respeito da classe de funções não lineares 
aqui considerada é que a hipótese de cada componente de %(-) € R” depender 
exclusivamente da respectiva componente do vetor de estado x € R” é por demais 
restritiva. É preciso, entretanto, notar que classes mais abrangentes também podem 
ser consideradas. Por exemplo, a equação diferencial não linear 


z(t) = My(Lz(t)) (6.121) 


em que M € R”*” e L € R”*” é não singular se reduz a (6.116) adotando-se a mu- 
dança de variável z = Lz. Assim procedendo, as mesmas condições de estabilidade 
agora se aplicam à matriz A = LM. 


6.5 Notas Bibliográficas 


Nosso objetivo, neste capítulo, foi colocar em evidência apenas alguns aspectos 
e resultados teóricos que consideramos os mais relevantes no âmbito do estudo de 
equações diferenciais não lineares. Temas muitos mais amplos e tratados de forma 
mais profunda são encontrados em diversas referências, incluindo os textos clássicos 
[23], [33] e [36]. Com as facilidades computacionais disponíveis nos dias atuais, torna- 
se possível traçar planos de fase com grande precisão. Isso viabiliza a análise global 
de trajetórias inseridas em regiões mais amplas que podem envolver diversos pontos 
de equilíbrio. A análise local do plano de fase via aproximação linear foi tratada 
de maneira simples e rápida, [1], [21]. As equações não lineares de segunda ordem 
receberam um tratamento especial, em particular no que diz respeito à análise de 
existência de soluções periódicas. Os pontos centrais e mais importantes envolvendo 
os resultados clássicos de Bendixson e Poincaré foram estudados dentro de um con- 
texto simples porém preciso, sabendo-se que maiores detalhes e abrangência podem 
ser conseguidos na referência [36]. Ao método da primeira harmônica, incluindo o 
estudo de estabilidade de soluções periódicas, é dado lugar de destaque. Acreditamos 
ter fornecido todas as informações, para torná-lo operacional e fazer com que o leitor 
=- possa aplicá-lo sem dificuldades em problemas específicos de seu interesse. O critério 
de estabilidade de Popov foi obtido seguindo-se um caminho bastante natural que 
nasce com os conceitos de passividade e positividade real. Isso foi possível tendo 
em vista os resultados de [5] sobre desigualdades matriciais lineares. Finalmente, de 
forma bastante breve, estudamos os critério de estabilidade de Persidiskii associado 
ao qual devemos citar [17], um dos primeiros trabalhos a calcular soluções diagonais 
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para a desigualdade de Lyapunov. O excelente e completo livro [22] é altamente 
recomendado aos interessados em se aprofundarem neste tema específico. 


6.6 Exercícios 


Exercício 6.1 Considere a equação diferencial não linear t — e” = 0, x(0) = 1 e o 


intervalo de tempo t € [0,10]. Determine sua solução: 

a) Analiticamente. 

b) Através do método de Picard. 
Exercício 6.2 Considere o sistema de um pêndulo conectado a uma massa de acordo com 
a Figura 6.22. Determine: 


a) A solução do modelo não linear correspondente a f(t) = 1 para todo t > 0 e condições 
iniciais x(0) = t(0) =0 , 0(0)=7x/4 , 0(0)= 0. 


b) A solução do modelo linearizado em torno do ponto de equilíbrio (0,0,0,0) e compare 
com o resultado do item anterior. 


DAA A FA 
Ze Lá Ee ze RE SR E 


Figura 6.22: Pêndulo com translação. 


Exercício 6.3 Considere a integral 
J - é qdo — xodx1 
C 


em que C é o elipsoide x'Qx = r? definido para r £0 e Q € R?*? definida positiva. 


a) Determine J e interprete-o utilizando o teorema de Green. 
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b) Calcule J parar = 2 e Q = I e, em seguida, parar = 1 e Q = diag(1,2). 


Exercício 6.4 O modelo predador-presa do Exemplo 6.10 admite crescimento ilimitado 
da população de presas na ausência de predadores. Entretanto, a competição por alimento 
entre os espécimes de presas não permite sustentar esta situação, o que nos leva a adotar 
um modelo que considere saturação na população de presas. Com esta finalidade, adotamos 
o seguinte modelo modificado [53]: 


p= apa pa 

à = Ba-ypa-— Aq 
Determine os pontos de equilíbrio deste sistema, classifique-os e discuta sobre a existência 
de soluções com trajetórias fechadas no plano de fase. 


Exercício 6.5 A equação diferencial a seguir é conhecida como equação de Duffing 
| ž+8ż— z(1 -= z?/2)=0 
na qual cA 0eó>0. 
a) Determine seus pontos de equilíbrio e classifique-os. 


b) Esboce as trajetórias do plano de fase nas proximidades dos pontos de equilíbrio. 


2 | 
c) E possível existir trajetórias fechadas no plano de fase? Em caso afirmativo, qual 
condição deve ser satisfeita? 
| | 
Exercício 6.6 Uma haste flexível de massa m possui uma de suas extremidades presa a 
uma parede e o coeficiente viscoso de atrito com o ar é c. Ao aplicarmos uma força com 
direção axial de intensidade u na extremidade livre a haste pode sofrer uma compressão caso 
essa força seja suficientemente pequena, ou flambar para valores suficientemente elevados 
de u. Denotando por z(x) a deflexão na direção normal ao eixo axial da haste na posição x 
medida a partir do seu centro, a força elástica de restauração é dada por Az +2? e o modelo 
matemático é dado pela seguinte equação de Duffing [33]: 
j n ae aÃ 
m-—2z+c—s Z+zº=4uz 
| dx? dz J 
a) Considerando como variáveis de estado z e dz /dx, determine os pontos de equilíbrio 
deste sistema para À > u e para A < u e classifique-os. 


b) Adotando os valores numéricos m = 1, ÀA = 0,2 e u = 1,2 desenhe as trajetórias no 
plano de fase para o caso sem amortecimento (c = 0) e para o caso em que c = 0,8. 


Exercício 6.7 Considere a equação diferencial não linear 


z =e +2=0 


em que |e| < a para algum a > O dado. 
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a) Determine o tipo do ponto de equilíbrio (0,0). 


b) A partir da linearização desta equação, é possível concluir sobre a estabilidade do 
ponto de equilíbrio (0,0)? Esboce e determine numericamente as trajetórias do plano 
de fase em uma vizinhança do ponto de equilíbrio. 


Exercício 6.8 Considere o diagrama de blocos de um sistema no qual está presente uma 


não linearidade simétrica, denotada pela função f(-). 


1 — s/4 


Figura 6.23: Sistema de controle com não linearidade. 


a) Para r = O determine, para o sistema em malha fechada, sua realização em espaço de 
estado considerando xı = e e x2 = é, seus pontos de equilíbrio e esboce as trajetórias 
no plano de fase. 


b) Repita o item anterior para r = 3. 


Exercício 6.9 A equação diferencial não linear a seguir é conhecida como equação de Van 
der Pool 


na qual 0< u< 2. 
a) Determine sua realização em espaço de estado para £1 = 2 e xo = 4. 
b) Determine seus pontos de equilíbrio e classifique-os. 


c) Esboce as trajetórias do plano de fase nas proximidades dos pontos de equilíbrio. 
d) Calcule o índice de Poincaré para cada ponto de equilíbrio. 
e) Mostre que não é possível existir trajetórias fechadas na região |z| < 1. 


Exercício 6.10 Um modelo simplificado para uma máquina síncrona é dado por 


ô + sen(ô) = 0,5 
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a) Determine seus pontos de equilíbrio e classifique-os. 


b) Determine as equações das trajetórias no plano de fase e esboce-as para =T < Ô < T. 


Exercício 6.11 Para o sistema dinâmico dado em seguida determine e esboce as suas 
trajetórias no plano de fase 


To y 

= —2-r+1/(1-— r)’ 
Exercício 6.12 Considere a equação diferencial não linear 

Z+2&wz +w’ z + ez’ = 0 


com w > 0. Determine e classifique os seus pontos de equilíbrio, considerando os seguintes 
casos: e<0,e=-0€ec>0)0. 


Exercício 6.13 Considere o sistema não linear de segunda ordem 


t = -22+Y 
= r(e? —3r+4)-—y 


a) Determine seus pontos de equilíbrio e classifique-os. 


b) Considere um ponto de equilíbrio estável, calcule a aproximação linear em torno dele 


e esboce o plano de fase em suas proximidades. 


Exercício 6.14 Para cada uma das funções não lineares dadas a seguir 


M , e>A/2 
a) fle) = O , lej<A/2 
-M_, e<x-A/2 


e+1 , e>1/2 
b) F(e) = de , lej<1/2 
gal a e<-1/2 


k(e—A/2) , e> A/2 
Og ELA 


gaas 
echo). o CGA 


determine a função descritiva Lp(a) associada a cada uma delas e esboce no plano complexo 


o lugar crítico —Lye(a)”! correspondente. 
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Oto 9 


Figura 6.24: Sistema de controle não linear. 


Exercício 6.15 Considere o sistema de controle na Figura 6.24 para o qual a função de 
transferência H(s) é dada por 

1 — s/4 
s2+s/2+1 
e f(:) é a não linearidade definida no item c) do Exercício 6.14. Verifique a existência 
de um ciclo limite para este sistema e, em caso afirmativo, conclua sobre sua estabilidade 
e determine a amplitude e frequência deste ciclo limite através da aproximação via função 
descritiva. 


H(sy= 


Exercício 6.16 Considere o sistema de controle da Figura 6.24, para o qual a não linea- 
ridade f(-) é do tipo histerese. 


1 


Existe ciclo limit H (s) = ? 
a) Existe ciclo limite para H (s) a 
1 
b) Para H(s) = 272841 determine o valor de £ > 0 de forma que exista um ciclo 


limite estável. Determine, então, sua amplitude e frequência através da aproximação 
via função descritiva. 


Exercício 6.17 Considere o sistema de controle não linear representado na Figura 6.24 
no qual a não linearidade f(-) é dada por 


k , e>1 
fle) = ke y qe <1 
-k , e<-—li 


e a função de transferência H(s) tem como representação de estado 


O 1 0 0 

È O © Tiziu 
0 -1 -2 1 

ee i ja 
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a) Determine k > O « l 
que garanta a existência d ) ii s 
em malha fechada. e um ciclo limite estável para o sistema 


b) Determine a amplitude e a 


E frequência do ciclo limi da g 
função descritiva. ite utilizando a aproximação 


via 


i 
s(s + 1)? 


a) H(s) = 


da (s + 2)(s + 5)(s + 10) 


Capítulo 7 


Robustez 


7.1 Introdução 


Todo e qualquer sistema dinâmico está sujeito a incertezas dos mais variados 
tipos. Por exemplo, os diversos sensores ao fazerem medidas das variáveis de interes- 
se com uma certa precisão necessariamente finita, introduzem erros. Da mesma 
forma, quando elaboramos um modelo matemático de um fenômeno físico, como 
um circuito elétrico, ele certamente dependerá de parâmetros tais como resistências, 
capacitâncias e indutâncias, cujos valores também só são especificados dentro de uma 
precisão considerada aceitável pelo projetista. Esse tipo de imprecisão, existente nos 
componentes dos sistemas de controle caracteriza a chamada incerteza paramétrica. 
Em um contexto mais geral podemos certamente incluir os atrasos introduzidos na 
malha de controle devido a necessidade de transmitir seus sinais à distância. Esses 
são os objetos de estudo deste capítulo. 


7.2 Normas 


Quando se deseja calcular o tamanho ou amplitude de alguma entidade matemá- 
tica S, elemento de um espaço linear S, lança-se mão do conceito de norma que é 
uma função real denotada por ||- || com as seguintes propriedades básicas: 


e ||S|| > 0 para todo Se Se ||S|| = 0 see somente se S = 0 € S. 


e IlaS!|| = |ol||S|| para todo escalar a e todo 5 € S. 
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e ||S1 + S2l| < ||S1l| + ||S2|| para quaisquer 91,52 € S. 


Desta forma, é evidente que as operações de soma e de multiplicação por escalar 
devem estar definidas em S. Por exemplo, para um vetor v € R” e as operações 
usuais com números reais, podemos verificar que as funções 


1/q 


lola = 4 X oil (7.1) 


para todo q > 1 € N satisfazem as condições anteriores e são portanto normas. Dois 
casos particulares são importantes, a saber, para q = 2 a norma |Jull = V'v'v recebe 
o nome de Euclidiana e para q = co, calculando o valor limite verificamos que ela 
é dada por |juloo = mazi=1... n|vi|. A partir destas normas para vetores, não há 
grande dificuldade para generalizá-las para matrizes A € R”*™, ou seja 


A 
[Ala = max Anla — max |jAvlle (7.2) 
-m 


De fato, é simples verificar que as duas primeiras propriedades básicas são satisfeitas. 
Ademais, com as relações 


| 


[41 + Ale = max (41 + Aall 
vlla= 


< e |Arvlla + || Aovlk 
< max || Ajvll + max || Asvll 
Ilullg=1 Iollg=1 
< [Ai + Asia (7.3) 


verificamos que a terceira também é válida. Normas assim definidas, a partir da 
norma de vetores, são denominadas normas induzidas. Novamente, um caso parti- 
cular importante é obtido para q = 2 quando (7.2) se reduz a 


'A'A 
|All = max == 


vÆ0 vu Ei) 


Felizmente, é possível mostrar que o vetor v € R” que resolve o problema de 
otimização acima indicado é o autovetor associado ao maior autovalor da matriz 
A'A € R7X” que é simétrica, semidefinida positiva e que portanto somente admite 
autovalores reais não negativos. À raiz quadrada de cada um dos m autovalores da 
matriz A'A recebe o nome de valor singular da matriz A e é denotado por o;(A), 
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para i = 1,---,m. Desta forma, a norma (7.4) de uma matriz qualquer se reduz a 
determinar o seu valor singular máximo, isto é || Alo = Cmaz( A). Por ser o maior 
autovalor de uma matriz, em geral, a sua determinação requer o uso de uma rotina 
computacional. 


Exemplo 7.1 Para provar que uma determinada função definida em um espaço linear é 
de fato uma norma devemos verificar se as três propriedades básicas são válidas. Em geral, a 
dificuldade se concentra na terceira propriedade denominada desigualdade triangular. Para 
a norma Euclidiana de vetores no R” devemos estabelecer que a desigualdade 


lvi + valo < Ivo + val) 


é válida para vetores vi,vo Æ 0 € R” arbitrários. Observe que para todo escalar u > O 
temos || gvi — v2/ All > 0 ou seja ulovil + |v2]$/u > 20/02. Em particular, para 
u = ||v2/2/]v1 ||2, obtemos a desigualdade 


viva < Iulallval)> 
a qual é usada para concluir 


lvi + vls = loill + us] + 2v1v2 
olá + lvl? + 2llvillollvoll2 


(Ivo + lella? 


IA IA 


que é o resultado desejado. Este exemplo ilustra uma estratégia de solução que pode ser 
adotada em vários outros problemas similares a este. E 


Normas de trajetórias como por exemplo v(t) : t > 0 > R” são induzidas pelas 
normas de vetores no R”. De fato, podemos verificar que 


1/q 


a | i jvi(t)|“dt (7.5) 
0 


onde v;(t) é a i-ésima componente do vetor v(t) € R” para cada t > O satisfaz as 
três propriedades básicas. Novamente, um caso particular importante corresponde 
à escolha q = 2 que se escreve na forma 


p = 55 f wat 


(7.6) 


| 
E 
e 
A~ 
se 
ESTO 
ds 
Cpo 
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permitindo que uma discussão importante seja feita. Pode ocorrer que as integrais 
indicadas em (7.5) e em (7.6) divirjam, fazendo com que a norma da respectiva 
trajetória seja ilimitada. É claro que nos interessamos, sobretudo, pelas trajetórias 
que admitem normas finitas. Em particular, o conjunto de todas as trajetórias tais 
que ||v||2 < oo é denotado por £2. 

Estamos, agora, em condições de introduzir duas classes de funções de variáveis 
complexas, denominadas H2 e Hæ, respectivamente, a partir do conceito de norma. 
Elas são compostas por funções do tipo H (s) : C — C"X™ que são analíticas no semi- 
plano direito complexo fechado. Em outras palavras o domínio da sua transformada 
de Laplace satisfaz 

| {s : Res) > 0 cD (7.7) 


de tal forma que jw € D para todo w € R. Por exemplo, se H (s) for uma função 
racional então todos os seus pontos singulares isolados, que são os seus polos, estão 
situados no semiplano esquerdo complexo aberto. Para cada w € R, denotamos 
H(jw)” € CX" como sendo a matriz conjugada transposta de Ea) E Cm, 
A matriz quadrada H(jw)“H (jw) € C™*™ é chamada Hermitiana pois é igual à 
sua conjugada transposta. Todos os seus autovalores são reais e como ela também 
é semidefinida positiva todos os seus autovalores são números reais não negativos. 
Neste caso, o valor singular máximo de H(jw) é igual à raiz quadrada do autovalor 
máximo da matriz Hljw H (jw). 


| 
| 


1.2.1 Classe Ho 


Esta classe é composta por todas as funções H (s) analíticas no semiplano direito 
complexo fechado que satisfazem a condição suplementar 


OO 1/2 
IHk= (5 / Tr(Hjo HG) | <00 (7.8) 


Observe que no caso afirmativo, a norma para esta classe de funções já está definida. 
Especialmente se r = m = 1 esta condição se escreve na forma mais simples 


trio = | = | i Hga} < 00 (7.9) 


— OO 


em que fica evidente a dependência exclusiva da norma com o módulo da função 
H(s). Em seguida, consideramos alguns exemplos que ilustram esta classe de funções 
e o cálculo de suas normas. 
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Exemplo 7.2 A função Hi(s) = 1 é analítica em todo o plano complexo. Ela é a trans- 
formada de Laplace do impulso unitário. Como a integral em (7.9) diverge, concluímos que 
Hi(s) É Ho. Da mesma forma a função Hə(s) = e 7º com 7 È> 0, é analítica em todo o 
plano complexo e é a função de transferência correspondente a um atraso de tempo 7. Como 


je JvT| = 1 para todo w € R, concluímos que Ha(s) É Ho. A função racional 


2 
s+1 


Hs(s) = 


que é a transforma de Laplace de 2e7* para todo t > 0 pertence à classe Hə. De fato, com 
(7.9) determinamos 


m = 5/52 
312 = TT 0 w2 + 1 
s 2 
que fornece a norma |Hs|> = v2. Observe que Hs(s) é uma função de transferência 
assintoticamente estável pois tem apenas um polo em s = —1. E 


E importante interpretar a norma que acabamos de definir no domínio do tempo. 
Neste sentido, vamos considerar que H(s) seja a função de transferência de um 
sistema dinâmico com entrada w € R” e saída z € R” que satisfaz 


2=H(s)ú (7.10) 


e que A(t) = LH(H(s)) € R"*” para todo t > O seja a sua transformada de Laplace 
inversa. Aplicando o Teorema de Parseval, obtemos ? 
E OO 


27 
/ TERORO dt (7.11) 
(0) 


|l 


IEI Tr(H (jw) H (jw) dio 


Il 


ficando aparente como se pode calcular a norma Ho no domínio do tempo. Esse 
resultado permite uma interpretação importante. De fato, com (7.10) notamos que 
cada coluna h;(t) € R” é igual a z;(t) que é a resposta do sistema correspondente à 
entrada impulsiva w(t) = e;ô(t), sendo e; € R” a i-ésima coluna da matriz identidade 
para todo i = 1,---,m. Consequentemente, usando (7.11) e (7.6), determinamos 


m., 


No / g hi(t) hi(t)dt 
"Jo 


Il 


|EN 


> liz: (7.12) 
Ei 


| 
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ou seja, o quadrado da norma Ha de uma função de transferência é igual à soma dos 
quadrados das normas das respostas ao impulso em cada canal da entrada. É claro 
que para sistemas com apenas uma entrada e uma saída a referida norma é igual à 
norma da sua resposta ao impulso. 

Nosso objetivo, agora, é calcular a norma Hs para uma função de variável com- 
plexa racional H(s) com um número qualquer de polos e de zeros. Isso nos leva a 
descrê-la através da forma já bem conhecida 


H(s) C(sI- AJ !B +D (7.13) 


com ACER?” B e R”*™, C e R"”” e D e R"*™. Para que ela seja analítica no 
semiplano direito complexo fechado, é imperativo que todos os autovalores de 4, que 
são os seus polos, estejam localizados no semiplano esquerdo complexo. Por outro 
lado, para que ela possa ser um elemento de Hə é necessário que a condição (7.8) 
seja satisfeita o que impõe H (joo) = 0, isto é D = 0. Em outras palavras, apenas 
as funções racionais estritamente próprias são elementos da classe Ho. 


Teorema 7.1 A norma Hə da função racional H(s) = C(sI — AJTIB € Hə pode 
ser calculada por uma das seguintes formas alternativas 


HI| = Tr(B'PB) = Tr(CQC") (7.14) 


onde PER” e Q €e RM” são as soluções simétricas semidefinidas positivas das 


equações de Lyapunov A'P+PA+C'C =Q e AQ+4+QA 4 BB' = 0, respectivamente. 


Prova : A transformada de Laplace inversa de H(s) fornece A(t) = Cet B para 
todo t >0. Portanto, com (7.11), obtemos imediatamente 


OO 
ig = | TAMA 
o. | 
= / (Be C' Ce B)dt 
0 
= (BPB) (7.15) 
tendo em vista que, como já sabemos (veja o Capítulo 3), a matriz simétrica 
| va 
P =| et tC'Celidt (7.16) 
0 


é a única solução semidefinida positiva da primeira equação de Lyapunov dada. Em 
seguida, usando uma das mais importantes propriedades da função traço, podemos 
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re-escrever (7.15) alternativamente como 


IHI 


| “TADRE dt 
0 


OO 
| Tr(Ce“ BB'e^*Ondt 
O 


= TAC QC) (7.17) 


onde uma vez mais, os resultados do Capítulo 3, permitem afirmar que a matriz 
simétrica 


OO 
Q = / e^t BB'e^tdt (7.18) 
0 


é a única solução semidefinida positiva da segunda equação de Lyapunov dada. Isto 
conclui a prova o teorema proposto. o 


Este teorema viabiliza a determinação da norma Hə de uma função racional 
estritamente própria qualquer desde que a matriz A tenha todos os seu polos no 
semiplano esquerdo complexo. O procedimento requer a solução de uma equação 
de Lyapunov e o cálculo do traço de um produto de matrizes. Entretanto, deve-se 
notar que mesmo para sistemas de ordem reduzida (segunda ordem), o emprego de 
uma rotina numérica se faz necessário. 


Exemplo 7.3 Para ilustrar os resultados anteriores, consideramos a função racional 


2s— 2 


H alee a E = 
Der 0,583 + 1052 +25 F9 


que pertence à classe Ho» pois é estritamente própria e todos os seus polos têm parte real 
negativa. Cada um dos dois gráficos da Figura 7.1 pode ser utilizado para calcular || H |» pela 
respectiva definição no domínio da frequência ou do tempo, respectivamente. Ao dividirmos 
a área mostrada no lado esquerdo por 27 obtemos o valor da área mostrada no lado direito 
da mesma figura. Ambos fornecem o mesmo valor ||H||5 = 0,4444. O resultado do teorema 
anterior permite um cálculo bastante eficiente desta quantidade. C 


Devido a igualdade (7.12), a norma Hə da função de transferência H(s) de 
uma sistema dinâmico pode ser interpretada como a energia total dissipada pelas 
perturbações impulsivas eventualmente presentes em todos os canais de entrada, até 
que elas sejam completamente atenuadas. Desta forma, se tivermos que projetar 
um sistema de controle, um critério de desempenho que pode ser adotado é o de 
tornar mínima a norma Hə da função de transferência entre a sua entrada e uma 
determinada saída de interesse. Esse aspecto será discutido com mais vagar no final 
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w [rad/s] 


Figura 7.1: Resposta em frequência e ao impulso 


deste capítulo ao tecermos considerações sobre desempenho robusto. No momento, 
vamos estudar com maior detalhes outra importante classe de funções de variáveis 
complexa denominada Hoo- 


7.2.2 Classe Ha 


Esta classe também é composta por funções H(s) analíticas no semiplano direito 
complexo fechado mas com a seguinte condição suplementar 


bles spo aaa HGA (7.19) 
wER 


que define a sua norma. Note que sup(-) indica o supremo que é menor limitante 
superior o qual, na maioria das vezes, se confunde com o valor máximo. Para o caso 
escalar, caracterizado por r = m = 1, a relação acima assume a forma mais simples 


Foo = sup |H(jco)] (7.20) 
WE 


que depende exclusivamente do módulo da função H(s) em consideração. Como 
podemos verificar, a classe de funções de varáveis complexas Hoo é mais abrangente 
que a classe Ho, isto é, H2 C Ho pois a condição (7.19) não requer que H (joo) = 0 
e, por conseguinte, que ela seja estritamente própria, isto é, com D = 0. 
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Exemplo 7.4 Com referência ao Exemplo 7.2, a função Hi(s) = 1 pertence à classe Ho 
pois |Hilloo = 1. O mesmo ocorre com a função Ho(s) = e77? com T z 0. Ela é analítica 
em todo o plano complexo e ||Ħ2ļļoo = 1. Da mesma forma, a função racional 


2 


Hs(s) E s+ 1 


pertence à classe Hoo. De fato, com (7.20) determinamos 


Haie | 2 
= up ——— 
|Hslão W 
m 4 


cujo valor máximo é atingido em w = 0 € R, fazendo com que, neste caso, o supremo e O 
máximo coincidam. Finalmente consideramos a função 


Lap S 
H4(s) = E 20 


que é analítica em todo o plano complexo. Isso pode ser verificado pelo desenvolvimento de 
e-7s em série de Taylor que coloca em evidência que s = 0 não é um ponto singular e 


eiTuw/? e eTiTuW/2 


Halgw)| 


eA 


Jw 
sen(Tw/2) 

i Tw/2 | 

< T, YwWER 


permite concluir que ela pertence à classe Hoo € | Hallo = 7, pois limy=0 Ha(jw)|=T. O 


Como no caso anterior, devemos fazer a interpretação desta norma no domínio 
do tempo. Sendo H(s) a função de transferência de um sistema dinâmico com 
entrada w € R” e saída z € R” que satisfaz a relação (7.10) com [Ho < 7 temos 
H(jw) ~“ H(jw) < ~2 a qual multiplicada à esquerda por W” e à direita por Ww Æ O 
fornece 

2 E— yr" < O (7.21) 

o que implica em = 
E / [202 — Ud dw <0 (22) 

PA R EA 


ou, pelo Teorema de Parseval, de forma equivalente 


n {zz — q ww} dt <0 (7.23) 
Jo 
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E importante observar que essa desigualdade é válida para toda trajetória w Æ 0 € 
La. Com efeito, só dessa forma as duas integrais presentes naquela desigualdade 
convergem. de w E La todos os polos de 1 têm parte real negativa, como esse 
também é o caso de H(s) € Hæ, O mesmo ocorre com 2 e assim z € Lo. A partir 


desta discussão, fica claro que para um dado y > 0 a desigualdade ||H]l% < y é 
verdadeira se e apenas se - 


OO 
sup / Zz-ywlwld 
a f “ww dt <0 (7.24) 
onde z(t) = h(t)» w(t) é a saída correspondente à entrada w. A solução desse 


problema de controle ótimo permite determinar os limitantes superiores de ||H || 
sendo o menor deles arbitrariamente próximo do seu valor. o 
Estamos, agora, em condições de calcular a norma Ho, de uma função racional 
genérica como aquela apresentada em (7.13). Entretanto, apenas para simplificar 
os cálculos, vamos considerar que H(s) seja estritamente própria impondo D = 0. 


E importante relembrar que essa condição não é necessária, para assegurar que se 
tenha H(s) € Ho. 


Teorema 7.2 Seja y > O dado. A função racional H(s) = C(sI — A)`!B € H 

satisfaz a desigualdade [Ho < y se e apenas se a desigualdade de Riccati o 
AP+PA+Y“PBB'P+C'C<0 (7.25) 

admitir uma solução P € RX” simétrica e definida positiva. 

Prova : A realização via representação de estado da função de transferência 


H(s) pode ser i p= 
o o na forma t = Ag + Bw, z = Cx com condição inicial nula. 
erando a função de Lyapunov v(x) = z’Px e uma condição inicial genérica 


v(0) = xo, a sua derivada em relação ao tempo fornece 
v(x) = (Ax + Bwy Pzr + zx'P(Ax + Bw) 
< —x'(y ° PBB'P + C'C)e +w B'Pz + x'PBw 
< =z'z +y ww — yu — y7? B'Pe)' (w -yB'Pa) (7.26) 
Porém, como o sistema é assintoticamente estável, para qualquer entrada w € Ls 


teremos x € Lo e, por consequência, x(00) = 0 d i 
| = U de tal forma que integrand 
os membros de (7.26), obtemos i REA NR 


OO 
La i i aanl 2 E = 
/ T z — y w w} dt < v(zro)—-y / (w — y ° B'Px)\' (w — y7’ B'Pr)dt 


< v(xo) (7.27) 
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que é válida para qualquer w € Lo. Fazendo zo = 0, a suficiência está provada. Para 
a necessidade, observamos que o valor ótimo do problema (7.24) ocorre para w = 
w* = y~? B' Pz sendo P > 0 uma solução de (7.25) tal que a matriz A+Y“BB'P 
seja estável para assegurar que w* € Lə. Como a desigualdade em (7.27) se torna 
arbitrariamente próxima da igualdade pelas escolhas adequadas deP>0ew= už, 
e como para xo = 0 a trajetória w* se torna nula, concluímos pela validade de (7.24). 
Isto prova o teorema proposto. o 


No caso em que a desigualdade de Riccati admita alguma solução definida posi- 
tiva, ela também admitirá uma solução P > 0 tal que A + Y “BB'P tenha todos 
os seus polos localizados no semiplano esquerdo complexo. Essa solução pode ser 
determinada de forma bastante simples definindo-se CL = [C" Vel] com e > 0 
arbitrariamente pequeno e determinando-se a chamada solução estabilizante da 


equação de Riccati 
A'P+PA+Y“PBB'P+CC =0 (7.28) 


pois CIC. = C'C + el faz com que a solução calculada satisfaça (7.25). Neste 
contexto, podemos propor um procedimento iterativo para a determinação da norma 
Ha. Ele se inicia com y > 0 suficientemente grande (y — 00) tendo em vista que 
(7.28) torna-se uma equação de Lyapunov cuja solução P > 0 certamente existe como 
consequência de A ser estável. O valor de y > O é progressivamente reduzido até que 
uma solução P > 0 com À + y2BB'P estável deixe de existir. O valor de y > 0, 
imediatamente anterior a esta última situação, estará arbitrariamente próximo de 
IH |l. Este procedimento é apenas conceitual pois na literatura existem diversos 
outros inclusive muito mais eficazes do ponto de vista numérico para calcular a norma 
Ha de uma função racional. Dentre eles, cabe citar aquele baseado na solução de 
desigualdades matriciais lineares que será objeto de estudo do Apêndice A. 
Exemplo 7.5 É possível calcular a norma Ho diretamente traçando-se o diagrama valor 
singular máximo expresso em dB, ou seja 2010g 190 mas (H (jw)) contra logyo(w) e determinar 
o seu valor máximo em um intervalo de frequências previamente escolhido. Como para 
sistemas com uma entrada e uma saída temos Omaz(H(jw)) = |H (jw)|, esse diagrama nada 
mais é que o diagrama de Bode de módulo. Com referência ao Exemplo 7.3, o gráfico do 
lado esquerdo da Figura 7.1 permite determinar |H||2, = maxo<w<s |H (jw)|* = 3,5386. 

A Figura 7.2 mostra o diagrama de valores singulares da função racional própria H (s) 
definida pelas matrizes 


0 1 0 0 0 1 
o 0 0 1 O o qo E g se 0 2 
AST go a LC ad D=[30] 
bo 0 ÃO =9 0 1 
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0 à i i PEI Te ES boda CLAE 2S 3 i , A A 66 ds a 
10" 10º to 10° 


w [rad/s] 


Figura 7.2: Diagrama de valores singulares 


Como todos os autovalores de A € Rt*4 têm parte real negativa, sabemos que H(s) € 
Hə. Ademais, como indicado na mesma figura, os dois valores singulares de H(s) e C2x2 
permitem determinar o valor máximo Omaz(H(jw*)) = 24,6900 [dB] que ocorre para w* 
0,8907 [rad/s], fornecendo, portanto, |H lo = 17,1593. 


ad 
(ad 


E 


Diferentemente da norma Ho» que depende de entradas exógenas do tipo impul- 
sionais, a norma Ho, admite uma interpretação de outra natureza. Como será visto 
nas seções seguintes, ela é um dos mais importantes conceitos que viabilizam o es- 
tudo de sistemas dinâmicos sujeitos a incertezas paramétricas e incertezas dinâmicas 
mais gerais como, por exemplo, aquelas devido à existência de atraso nas variáveis 
de estado. Na verdade, os resultados teóricos a serem estudados em seguida só po- 
dem ser corretamente entendidos e adequadamente utilizados a partir da fixação do 
conceito de norma Hw, como acabamos de expor. 


7.3 Estabilidade Robusta 


Não há como evitar a presença de incertezas em projetos de sistemas de controle. 
Em particular, os modelos matemáticos dependem de parâmetros que são medidos 
com certa precisão que naturalmente define um intervalo de incerteza dentro do qual 
todos os valores são igualmente possíveis e aceitáveis. Um modelo simples e bastante 
geral que permite descrever incertezas paramétricas em equações diferenciais lineares 
homogêneas é expresso na forma de representação de estado 


è= (A + BAC)g (7.29) 
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| A ` a mx”r 
AcR“”, BERT e Ce R"*" são matrizes dadas e a matriz A € R 
E o o o 
a a incerteza ou imprecisão que se quer considerar. Assim sendo, a matrız 
hecida mas sabemos que ela pertence a um conjunto Q, definido por 


Q= {A ER™" : lAl < yt} (7.30) 


onde 
represent 
A não é con 


0 um escalar escolhido pelo projetista. Notamos, imediatamente, que 

mpre A = 0 € Q e para este valor obtemos de (7.29) o chamado modelo nomi- 
ae — Arv. As matrizes B e C são essenciais para que as incertezas atuem nos 
nal t = . 


etros corretos cujos efeitos se deseja estudar. E importante observar o efeito 
seu valor, menor é a amplitude da incerteza 


com y 2 


param | 

do escalar y > 0. Quanto maior O 

paramétrica em consideração e vice-versa. | ne em 
Para ilustrar o que acabamos de descrever, consideramos um movel de mas 


preso a uma mola com coeficiente de elasticidade « que se desloca em um ep 
com coeficiente de atrito viscoso b a partir de condições iniciais dadas. O seu e i 
camento y(t) em relação a um referencial inercial, obedece a equação diferencial de 


segunda ordem 


mij(t) + (b + Sby lt) + (s + ôr)yt) = O (7.31) 


sujeita às condições iniciais de posição y(0) e de velocidade y(0). Fica evidente r 
estamos assumindo que os coeficientes de elasticidade e de atrito viscoso nao 
conhecidos exatamente, mas sim dentro de um intervalo de incerteza lôk|/k < P 
jôb|/b < p. Nota-se que p > 0 define uma imprecisao máxima, em o Ea 
ntuais, relativo ao valor nominal do respectivo coeficiente. A partir do ve 


ce i 
[y g| € R?, verificamos sem dificuldades que a representação de estado de 


£= 
(7.31) 
= j : (7.32) 
T= | (n+ó9)/m —(b+ôb)/m 
pode ser escrita na forma padrão (7.29) com 
0 1 0 o J= 0 (7.33) 
= D= To l 
a= em a Lim es 


e A = [5k/k b/b] € R°. Finalmente, para completar o modelo é preciso A 
/ 
o conjunto Q através da determinação do valor de y > 0. Como AA” < 2pº para 


ôk e ôb factíveis, a escolha y = 1/ V2p torna-se evidente. = 
Sob quais condições o ponto de 


globalmente assintotica- 
e Q? A resposta, até 


todos 

“ Neste momento, surge uma questão importante. 
equilíbrio x = 0 da equação diferencial (7.29) permanece 
mente estável para toda incerteza paramétrica que satisfaz A 
certo ponto surpreendente, é dada através do seguinte teorema. 
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Teorema 7.3 Seja y > 0 dado. O ponto de equilíbrio x 
Riccati 

AP+PA+Y“PBB'P4C'C <0 (7.34) 
admitir uma solução P E R"X" simétrica definida positiva. 
Prova : Supondo que (7.34) admita uma solução P > 0, adotamos a função de 


Lyapunov v(x) = x'Py para a equação diferencial (7.29) 
ao tempo fornece 


(z) 


, cuja derivada em relação 


Il 


r(A + BACY Pr +x'P(A+ BAC)x 

q (A'P+ PAJjx+27'PBACE 

=2(C'C + y“PBB'P)x +22'PBACE 
=2(0=A'B'PHMC=A'B'Pp- vPB(y *I- AANB'Py 

= PBO T - AMNB'Pg (G39) 


Il 


MN A 


Entretanto, como AA’ < yT°I para todo A € Q, a desi 
v(x) < 0 para todo z Æ 0 € R” 
proposto. 


gualdade acima implica que 
e todo A E Q, o que encerra a prova do teorema 


L] 


A comparação entre os resultados dos Teoremas 7.2 e 7.3 é inevitável. O primeiro 
nes que se IC(s7 5 A)! Bllo < y, então existe uma solução P > 0 para a 
esigualdade de Riccati (7.25). Mas como (7.25) é idêntica a (7.34), o segundo 


implica por sua vez que a matriz A + BAC é estável para qualquer matriz A € Q 
De maneira equivalente, reescrevendo (7.29) como | 


è = Ar+ Bw (7.36) 
Cr (7.37) 
tp = ÃO (7.38) 


entao a função de transferência H (s) = C(sI — A) 


entre a entrada w e a saí 
z ter norma H o 


a co menor que y assegura que o sistema em malha fechada obtido 
ando w e z sao conectados através l l 
de uma matriz com norma Ho menor ou igual 


do que y7! À l 
q ey permanece estável. Assim, para manter a estabilidade devido a presença 
e mcertezas paramétricas, basta impor a relação 


[Elo lA = VÃO (7.39) 
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| = 0 da equação diferencial 
(7.29) é globalmente assintoticamente estável para todo A EQ sea desigualdade de 
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T wÙ 
= + H(s) 


Figura 7.3: Diagrama de blocos com incerteza 


Sua importância reside no fato de que a matriz A não é fixa mas, ao contrário, pode 
variar dentro do conjunto Q, que exige apenas que todas elas sejam reais e tenham 
norma Ho limitada pelo parâmetro y > 0, inversamente proporcional à amplitude 
máxima das incertezas paramétricas que se deseja considerar. 


Exemplo 7.6 Vamos considerar o sistema dinâmico descrito pela equação diferencial 
(7.32). Como se trata de uma equação de segunda ordem, a sua estabilidade está garan- 
tida para todo A tal que ||Allo < 1 pois, desta forma, as incertezas paramétricas não 
alteram os sinais dos seus coeficientes. Para aplicar o teste de estabilidade (7.39) ado- 
tamos os valores nominais m = 1 [kg], x = 100 [N/m] e b = {1,10,25} [Ns/m]. Para 
cada um dos três conjuntos de valores nominais, calculamos a função de transferência 
H(s) = C(sI — AJT!B e sua norma ||H lo, respectivamente. Obtemos então os limitantes 
| Allo < {0,0995; 0,6811; 0,9046}. O critério de estabilidade baseado na norma Ho, fornece 
resultados melhores conforme o coeficiente de atrito viscoso aumenta, ou seja, para valores 
maiores do coeficiente de amortecimento. Note que a sequência obtida se aproxima mas não 
atinge a situação ideal ||Allo < 1. 

É interessante notar que alterando em (7.33) a matriz C para C = [0 — b] estudaremos 
apenas incertezas no coeficiente de atrito viscoso. Com os mesmos valores nominais calcu- 
lamos ||H|loo para obter ||Alloo < (0,9950; 0,9950; 0,9950} cujos valores são iguais e estão 
muito próximos do resultado ideal (a depender da precisão dos cálculos). C 


“Dois pontos devem ser ressaltados. O primeiro é o caráter meramente suficiente 
da condição de estabilidade (7.39) consequência do Teorema 7.3 e ilustrado com o 
Exemplo 7.6. O segundo diz respeito ao conjunto Q, que contém apenas matrizes 
reais. Essa condição pode ser relaxada para incluir funções de transferência do tipo 
A(s) E Ho, que sejam analíticas em todo o semiplano direito complexo. 

Com efeito, vamos generalizar os resultados anteriores para levar em conta in- 
certezas dinâmicas. Neste sentido, consideramos o sistema de controle descrito na 
Figura 7.3 onde H(s) é uma função de transferência racional dada por H(s) = 
C(sI — AJiB e C'XM e A(s) € C™*" é uma função de transferência desconhecida 
a respeito da qual apenas sabemos que ela pertence ao conjunto 


E = (A(s) e Cr: Alo £7} aa) 
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Como anteriormente, nosso objetivo é obter condições para assegurar que o sistema 
dinâmico em estudo seja assintoticamente estável para toda A(s) € E. Convém 
salientar que as incertezas agora são produzidas por funções de transferência da 
classe Hoo e, portanto, assintoticamente estáveis. O teorema dado a seguir contém 
um dos mais importantes resultados da área de controle robusto. 


Teorema 7.4 (Teorema do pequeno ganho) Seja y > 0 dado e assuma que 
H(s) € Ho. As seguintes afirmações são verdadeiras: 


a) Se [Ho < y então VA(s) € E o sistema da Figura 7.8 permanece estável. 


b) Se l| Hll > y então existe A(s) € E que torna o sistema da Figura 7.3 instável. 


Comparando com o resultado do teorema anterior, notamos que se nos restringir- 
mos à classe Q C & de incertezas reais apenas o primeiro item do Teorema 7.4 é 
válido. Ou seja, naquele caso, se [Ho > y pode não existir A € Q que torna 
o sistema da Figura 7.3 instável. Deve ser ressaltado que o teorema do pequeno 
ganho não requer que as funções de transferência H(s) e A(s) sejam racionais o 
que viabiliza o seu uso para o estudo de estabilidade de sistemas, por exemplo, com 
atraso. | 

O Teorema do pequeno ganho pode ser interpretado à luz do critério de Nyquist. 
Com este objetivo, vamos supor que H(s) e A(s) sejam funções racionais com uma 
entrada e uma saída (r = m = 1) e que pertençam à classe Hoo. Não há dificuldades 


para estudarmos a sua estabilidade com o critério de Nyquist aplicado à equação - 


característica 1 + H(s)A(s) = 0. Como os polos de H(s) e de A(s) estão localizados 
no semiplano esquerdo complexo, a estabilidade do sistema em malha fechada é 
assegurada se e somente se o mapeamento de H(jw)JA(jw) não envolver o ponto 
crítico —1 + j0. Por outro lado, como |[H(jw)| < |El e |A(jw)| < |Allo para 
todo w E R, a existência de y > 0 tal que [Ho < 7 e |Allo < 77t fornece 


EG AG] < IHGIAÇu)| 
< Ho lAllo 
< 1, YweR (7.41) 


e implica que o ponto crítico não é envolvido, que nada mais é que a primeira 
parte do Teorema 7.4. Se a desigualdade acima for violada para alguma frequência 
w € R, existirá uma função A(s) de tal forma que o ponto crítico seja envolvido e 
a estabilidade perdida, como atesta a segunda parte do mesmo teorema. É claro 
que, se aplicarmos o teorema anterior para uma função de transferência A(s) E Ho 
específica, somente a sua condição suficiente (primeira parte) permanece válida. 


73. ESTABILIDADE ROBUSTA 301 


V agora. estudar sistemas dinâmicos com atraso, com a estrutura daquele 

ppa a í de entradas e de saída 

mostrado na Figura 7.3 sendo que H (s) tem o mesmo número de entrada : 
isto é m =r. A sua representação de estado é da forma 


i(t) = Ax(t) + Bw(t) (7.42) 
w(t) = r(t) ss z(t E T) (7.44) 


onde 7 > 0 é o atraso. Aplicando a transforma de Laplace, verificamos que H (s) = 
C(sI = AJIB e CT% e A(s) = e 7º] € C'%”. Entretanto, como IA(s)loo = 10 
teorema do pequeno ganho pode ser aplicado com y = 1 para fornecer imediatamente 


o seguinte resultado. 
Lema 7.1 Se a função de transferência H(s) = C(sI — AJT!B satisfaz 
|All < 1 (7.45) 


então o sistema dinâmico (7.42)-(7.44) é assintoticamente estável para todo T 2 Q. 


Essa condição de estabilidade é, em geral, muito conservadora. O motivo é que a 
estabilidade é assegurada não apenas para A(s) = e 7TSI mas para todo A(s) € ka 
que satisfaz ||Allo < 1. Uma maneira de obter resultados mais precisos e 
em introduzir uma variável adicional V € R"*” não singular, denominada matriz de 
escalamento. Inicialmente, calculamos a função de transferência em malha fechada 


2 = F(s)” como sendo 
=l 
F(s)= (I+ Slam TUE) (7.46) 
a qual torna aparente que a sua equação característica admite a fórmula alternativa 


0 


| 


des (1 + e-TSH(S)) 
det(V)det (T + e TS H(5)) det(V?) 
det (I + e TVH(S)V) (7.47) 


Il 


e assim as suas raízes são invariantes em relação à escolha particular k matriz 
ão SI $ é muito i er resultados mais 

V e R'*” não singular. Porém, ela é muito importante para se obt presa 

precisos com o objetivo de assegurar a estabilidade assintótica do sistema dinâmic 


com atraso em estudo. 
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Lema 7.2 Se para uma matriz V E R'X” 
H(s) = C(sI — AJIB satisfaz 


nao singular a função de transferência 


IVHV =l < 1 (7.48) 


entao o sistema dinâmico (7.42)-(1.44) é assintoticamente estável para todo T > 0. 


Com o Teorema 1.2 este resultado implica em determinar matrizes simétricas 
P >Q0e R>0Q0 que satisfaçam a desigualdade de Riccati 


E | 
AP+PA+PBRIB'PAC'RC <0 (7.49) 


em que R = V'V e R'X”. Essa tarefa não é sim 


: | ples pois a determinação de R 
via tentativa e erro é praticamente im : Ea 


| possível. Felizmente, com o Complemento de 
Schur (veja o Apêndice A) verificamos que a desigualdade (7.49) é equivalente a 


A'P+PA4C'RC PB 
<0 (7.50) 


BP =h 


que é uma desigualdade matricial linear em relação às duas 
P > 0e R >Q, viabilizando a sua solução 
também discutido no Apêndice A. É claro que 
e uma saída, a matriz V torna- 
condição (7.48). 

Uma questão interessante que surge naturalmente, neste ponto, diz respeito à 
eventual existência de uma função de Lyapunov associada ao ERA com at 
(7.42)-(7.44) que permita estudar a sua estabilidad rg 
denominada função de Lyapunov - Krasovskii 


matrizes incógnitas 
através do procedimento numérico 
se H(s) tiver apenas uma entrada 
se um escalar que não produz qualquer efeito na 


e. Uma das mais famosas é a 


t 
oE) =2(0/Po(o) + [ef Re(ejde (7.51) 
t—T 
onde P > 0e R > 0, matrizes de dimensões com 
sempre positiva. Sua derivada em relação 
nula r(t) = 0, é calculada como sendo 


pativeis, garantem que ela seja 
ao tempo para o sistema com entrada 


(z) = 2e(t) P(Ax(t) — Bz(t — 7)) + z(t) Rz(t) — z(t — T)'Rz(t — 7) 
TO (A P EPAL C'RC)x(t) — 2) PBa(t - 7) — at =T) Ra(t=7) 
E | x(t) Ta r(t) | 


2(t — 7) B'P — R a(t — 7) (7.52) 


—_—— A 
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e, assim, se a condição (7.49) é verificada temos v(x(t)) < O para todo r > 0, 
estabelecendo uma vez mais a estabilidade assintótica do sistema dinâmico (7.42)- 
(7.44). A mesma condição de estabilidade fornecida pelo teorema do pequeno ganho 
é obtida com a função de Lyapunov-Krasovskii. 


Exemplo 7.7 Considere a equação diferencial Y(t) + 4y(t) + 4y(t) + kylt — T) = 0 com 
H>20e7 >0. Por ser de segunda ordem, para r = 0, é imediato verificar que ela é 
estável para todo «x > 0. No caso geral, sua equação característica pode ser escrita na forma 
1 +e TS H(s) = 0, onde | 
K 
H(s)=——s 
(5) CETE 
é da classe Hoo e |H llo = K/4. Desta maneira, pelo Lema 7.1 podemos afirmar que se 
0 < k < 4 a gua estabilidade é assegurada para todo r > 0. A mesma equação característica 


tem a forma 1 + «G(s) = 0, em que 


ES 


CUT GFA 


com a qual podemos aplicar o critério de Nyquist. Como os dois polos de G(s) estão no 
interior do semiplano esquerdo complexo, determinamos a frequência de cruzamento com o 
eixo real Im(G(jwe)) = 0 e a condição de estabilidade é expressa por O < r < 1/|G(jwc)|. 
Algumas manipulações algébricas desta condição nos leva a concluir que a estabilidade será 
preservada para todo 7 € |O, Tmar) onde Tmar = +00 se0<n<4e 


sE 


Tmaz — 
vn — 4 


ser > 4. A Figura 7.4 ilustra o mapeamento da função G(s) para r = 0 em linhas contínuas 
e para 7 = 1 em linhas tracejadas. No primeiro caso, sem atraso, não há cruzamento 
com o semieixo real negativo. Porém, para qualquer valor de r > 0, sempre ocorrerá um 
cruzamento cujo efeito é de impor um limitante superior para o ganho « > 0. A condição de 
estabilidade fornecida pelo teorema do pequeno ganho é bastante restritiva pois é verificada 
apenas para k € [0, 4), enquanto que o critério de Nyquist diz que a estabilidade pode 
ser mantida desde que um limitante superior para o ganho «K > 0 seja convenientemente 
estabelecido. o 


Estas duas últimas condições de estabilidade são independentes do atraso, ou 
em outras palavras, asseguram a estabilidade para todo r > O. Como vimos no 
exemplo anterior e já comentamos anteriormente, elas são bastante restritivas pois 
exigem que o sistema em estudo seja estável não só para A(s) = e 75I mas para 
toda A(s) € Ho que satisfaz ||Allo < 1. 

Na tentativa de determinar uma condição mais precisa, desejamos determinar 
o valor máximo do atraso Tmaz de tal forma que a estabilidade ocorra para todo 
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Figura 7.4: Mapeamento de G(s) 


T, '. 

ua mar). Para que isso possa acontecer 
f ) 

seja assintoticamente estável para T = 0. Sobe 


determinamos a função de transferência 


assumimos que o sistema em estudo 
sse enfoque, a partir de (7.42)-(7.44) 


ole) = ERGE 


Ra (7.53) 

onde Ao = A — BC e Rºxn | 

, tem todos os seus : 
polos local . i 
o esquerdo complexo. O resultado a seguir se b i pano na ameron do 
e que a função asela no fato já conhecido 
—TS 
N EN D 

S (7.54) 


é da classe Ha e AlS) = rT 


f para todo 7 > 
éum dos seus polos. Esta fi 720. Vale a pena observar que s = 0 não. 


nçao é analítica em todos os pontos do plano complexo 


Lema 7.3 Assuma que Fo(s) E Ho e defina 


Tmas = |sFo(s) lo 


O sistema dinâmi 4 
a dinâmico (7.42)-(1.44) é assintoticamente estável para todo T € 


Prova : 


(7.55) 


o 0, Tmax). 
Inicialmente fatoramos a equação característica na forma 
0 = det(1+ e CH(s)) 
= det(I+H(s)+ A(s)sH(s)) 


= det(1 + H(s))det (1 + A(s)sFo(s)) (7.56) 
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e notamos que as raízes de det(I+H(s)) = 0 são os polos de Fo(s), todos estáveis por 
hipótese. As demais raízes são forçadas a estarem localizadas no semiplano esquerdo 
complexo aplicando o teorema do pequeno ganho para todo || A(s)loo < T. Assim 
procedendo, concluímos pela estabilidade assintótica para todo T > O que satisfaça 
|sFo(s)llo < Tt, o que prova o lema proposto. E 


Não há dificuldade alguma de se introduzir uma matriz de escalamento para 
melhorar o resultado do Lema 7.3. Em primeiro lugar, devemos obter a função de 


transferência 


sFo(s) C's(sI — Ao)! B 

| OB CAI =A B (7.57) 
que se reduz a sFo(s) = CA(sI— Ao)! B no caso bastante frequente em que CB = 0. 
Em outras palavras, sFo(s) é uma função racional estritamente própria. Sob esta 
hipótese, adotando o mesmo raciocínio empregado no Lema 7.2, devemos determinar 
o máximo valor der > O tal que P > 0 e R > 0 tornem factível a desigualdade de 


Riccati 
AGP + PAo + T°PBR'B'P + A'C'RCA <0 (7.58) 


a qual, com o Complemento de Schur, pode ser escrita na forma equivalente 


AoP + PAo + A'C'RCA TPB ea (7.59) 

TBP -R 
Para 7 > 0 fixo, essa é uma desigualdade matricial linear. Portanto, o valor máximo 
de 7 > 0 é determinado através de um procedimento de busca unidimensional 
garantindo, passo a passo, a existência de solução em relação às demais variáveis 
(P, R). É claro que, no caso de sistemas com uma entrada e uma saída, o cálculo 
direto de Tmar segundo preconizado pelo Lema 7.3 é o procedimento mais indicado 
e simples. 


Exemplo 7.8 Vamos estudar, novamente, a equação diferencial de segunda ordem do 
Exemplo 7.7 com x > 0er > 0. A partir de H(s) = k/(s + 2)?, calculamos 
KS 


o ae E 


e sua norma ||sFo(s)lloo = 4/4. Neste caso, o Lema 7.3 assegura a estabilidade para todo 
atraso menor que Tmaz = 4/K. Comparando com os valores obtidos no Exemplo 7.7 notamos 
que para 0 < «K < 4 o Lema 7.1 fornece Tmar = +00, nitidamente melhor que o valor acima 
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obtido com o Lema 7.3. Porém, para « > 40 Lema 7.1 não permite nenhuma conclusão sobre 
a estabilidade, enquanto que o Lema 7.3 apenas impõe uma limitação para o ganho ~x. É 
claro que ambas, por serem apenas condições suficientes de estabilidade são mais restritivas 
que as obtidas pela aplicação direta do critério de Nyquist. o 


A seguir, vamos abordar uma questão importante no contexto de robustez que 
diz respeito à determinação do desempenho que se pode esperar de sistemas sujeitos 
a incertezas. Naturalmente, iremos calcular o desempenho de pior caso denominado 


desempenho garantido, caracterizado pela incerteza mais desfavorável que eventual- 
mente possa ocorrer. 


7.4 Desempenho Robusto 


Até agora, estudamos os efeitos de incertezas na estabilidade de sistemas dinâmi- 
cos, resta, entretanto, verificar como elas afetam os seus respectivos desempenhos. 
Neste contexto, o ponto central é que não basta projetar um sistema de controle 
que opere de forma adequada face a uma situação dita “nominal”, pois incertezas 
podem alterar de maneira dramática o seu comportamento e levá-lo a operar fora 
de uma faixa com desempenho aceitável. Para estudar este importante aspecto, 
consideramos inicialmente o seguinte sistema dinâmico 

| 


! 
k! 


t = (A+ BAC)z, x(0) = xo (7.60). 


com condição inicial não nula e A € Q para algum y > 0 dado. O nosso objetivo é 
determinar o valor do custo garantido u > O que satisfaça 


/ e r <u, VA ER (7.61) 
JQ 


sendo Q € Rº*” uma matriz simétrica semidefinida positiva. O procedimento 
baseia-se na existência de uma função de Lyapunov associada ao sistema (7.60) 
que e válida para toda incerteza factível. 


Teorema 7.5 Seja y > 0 dado. O ponto de equilíbrio x = O da equação diferen- 


cial (7.60) é globalmente assintoticamente estável e u = xọPxo satisfaz (7.61) se a 
desigualdade de Riccati 


AP+PA+Y“PBBP+C'C<-Q (7.62) 


admitir uma solução P € R"*” simétrica definida positiva. 
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Prova: Se P > 0 resolve a desigualdade (7.62), ela também satisfaz as condições 
do Teorema 7.3 e, portanto, a estabilidade assintótica do ponto de equilíbrio está 
assegurada e x(00) = 0. Adotado a função de Lyapunov v(x) = x'Px e as mesmas 
fatorações de (7.35), verificamos que 


Wey <r Qa VAEN (7.63) 


cuja integral no intervalo [0,00) fornece (7.61) com u = v(xo) = £oP £o, O que prova 
o teorema proposto. E 


A função de Lyapunov calculada em z = zo define um limitante superior que é 
válido para toda incerteza factível. Nenhuma delas poderá gerar um custo maior 
do que u assim calculado. Por outro lado, infelizmente, não é verdade que p seja 
o menor custo garantido no sentido de existir À € Q tal que a igualdade em (7.61) 
ocorra. Para melhor entender esta discussão, vamos impor y — 00 de tal maneira 
que Q contenha apenas um elemento A = 0€ Q. Neste caso, (7.62) se torna uma 
desigualdade de Lyapunov a qual permite determinar 


EA At 
pos / che (CO + Q)e™ zodt 
| na | 
= / rhet Qe“ rodt (7.64) 
0 


ou seja, o custo garantido é estritamente maior que o custo do sistema nominal 
quando deveria ser igual. O resultado do Teorema 7.5 introduz um certo grau de 
conservadorismo mas é bastante útil para se poder avaliar o impacto das incertezas 
no desempenho de sistemas de controle. | 

Passamos, agora, a fazer o mesmo estudo para sistemas com atraso. Como vimos, 
é imperativo ter em mãos uma função de Lyapunov que possa fornecer um limitante 
superior u para o custo quadrático que se deseja calcular. Neste sentido, a função 
de Lyapuov-Krasovskii é de fundamental importância para impor relação 


OQO 
/ Hb Qe(idt <u, VT DO (7.65) 
0 

sendo z(t) uma solução das equações de estado (7.42)-(7.44) com entrada nula A a 
O e sujeitas à condição inicial não nula x(0) = xo e z(t) = 0 para todo =T < t < 0. 

Teorema 7.6 Se existirem matrizes simétricas P > 0 e R > 0 que satisfazem a 


desigualdade de kiccati 
A'P+PA+PBR!B'PA4C'RC<-Q (7.66) 
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então o sistema com atraso representado pelas equações de estado (7.42) (44) com 
entrada nula é globalmente assintoticamente estável e u = xyPxo satisfaz (7.65). 


Prova: Se P > 0e R > 0 satisfazem a desigualdade (7.66), adotando a função de 
Lyapuov-Krasovskii (7.51) e as mesmas fatorações que aparecem em (7.52), verifi- 
camos que a relação 


vlx) < —r'Qa, VT >0 (7.67) 


é válida. A sua estabilidade assintótica é estabelecida e, portanto, x(00) = 0. Ade- 
mais, a sua integral no intervalo [0,00) fornece (7.65) com u = v(xo) = xgPzo, O 
que prova o teorema proposto. o 


Como já foi dito, devemos esperar que o resultado do teorema anterior seja 
conservador pois o limitante superior u deve valer para todo atraso r > 0. Em 
contra-partida a sua simplicidade é notável. Uma solução da desigualdade de Ric- 
cati (7.66), em relação às variáveis matriciais P > 0 e R > 0, pode ser numeri- 
camente calculada convertendo-a em uma desigualdade matricial linear. Nos dois 
casos, a saber, o de sistemas com incertezas paramétricas e o de sistemas com atraso, 
limitantes superiores das suas normas Hs e Hoo, podem ser calculados sem muitas 
dificuldades adicionais adotando-se o mesmo procedimento anterior, que se baseia 
no conhecimento das funções de Lyapunov a eles associadas. 


7.5 Notas Bibliográficas 


Neste capítulo, tratamos de um assunto extremamente importante e atual na 
área de sistema de controle. Inicialmente, uma breve introdução do conceito de 
norma de vetores e de matrizes, já bastante conhecida e discutida em diversos tex- 
tos como por exemplo [8] e [36] foi feita. Em seguida, o objetivo foi de levar o 
leitor a conhecer espaços lineares mais abrangentes denominados Hə e Ho cujos 
elementos são funções de transferência analíticas no semiplano direito complexo. 
Neste assunto, os livros [9] e [37] são altamente recomendados para uma leitura adi- 
cional mais específica e aprofundada. Dois aspectos envolvendo robustez de sistemas 
“dinâmicos foram abordados com maiores detalhes, a saber, sistemas com incertezas 
paramétricas e sistemas com atraso. Para um maior aprofundamento nestes dois 
assuntos, recomendamos as referências [10] e [24] como forma de obter mais in- 
formações a respeito de diversos aspectos que são muito estudados na atualidade. 
Por exemplo, a introdução de atraso em sistemas de controle torna-se quase que 
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inevitável quando se tem que enviar as medidas e os sinais de comando através de 
uma rede de comunicação. Esta problemática, inclusive envolvendo a modelagem do 
meio de comunicação empregado, é tratada em [18]. Finalmente, é preciso colocar em 
evidência o magistral texto [5] que versa exclusivamente sob os mais diversos aspec- 
tos das chamadas desigualdades matriciais lineares. Tentamos colocar esse conceito 
em evidência como uma alternativa real para tratar numericamente os problemas 


aqui abordados. 


7.6 Exercícios 


Exercício 7.1 Considerando v € R? esboce os lugares geométricos correspondentes a 


lullg=1 parag=1,g=2eq=o0. 


Exercício 7.2 Para A € R"*”, mostre que ||Al| = VTr(A'A) satisfaz as propriedades 


básicas e é portanto uma norma. 


Exercício 7.3 Verifique se a função 


2 
Wn 


s2 + 2Ewns + w2 


H(s) = 
com E > 0 e wn > 0 pertence à classe Ho. No caso afirmativo determine a norma ||H ||2- 


Exercício 7.4 Verifique se a função H(s) do Exemplo 7.5 com & > 0 e wn > O pertence 
à classe Hoo. No caso afirmativo determine a norma | H oo. 


Exercício 7.5 Verifique se a função 


1 Eus Es 


H(s) ; 


com T > 0 pertence à classe Ho. No caso afirmativo determine a norma IH. 


Exercício 7.6 Seja H(s) uma função racional. Mostre que para as normas Ha e Ho 
valem as relações |H|> = ||H'|> e [Ho = |Hoo- 


Exercício 7.7 Para o sistema com atraso &(t) = Ax(t) — BCx(t — rT) com condições 
iniciais x(0) = xo e z(t) = &(t) para todo —T < t < 0, determine u de tal forma que 


J r(t —TYQr(t—rT)dt < u, Yr >20 
0 
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Exercício 7.8 Considere z € C e mostre que a igualdade 
1 A h 
b= L ú 
k=0 


ocorre se e somente se zl< 1. Com este resultado, calcule a transformada de Laplace 
inversa, definida para todo t > 0, das funções: 


a) f9) = 
b) fl) = 


“HO GFA e) 


Exercício 7.9 Considere a equação diferencial com atraso 
Ü) + 34t) + 2y(t) + kyt -7r)=0 


onde K > 0 erT € {1,2,3}. Com o critério de Nyquist, para cada valor de T, determine os 
valores de k que preservam a sua estabilidade assintótica. 
Exercício 7.10 A função de transferência de um sistema com atraso é dada por 


1 


H(s To ———— o íÇ. 
(s) sps? dedke 


Determine a região de estabilidade (K,T) utilizando: 
a) O critério de Nyquist. 


b) O critério de Routh, com as aproximações de primeira e de segunda ordens para e TS. 


Exercício 7.11 Um sistema com atraso tem a seguinte equação característica 
P(s)+ ke =0 


onde k > 0, T > 0 e todas as raízes de P(s) = O estão localizadas no semiplano esquerdo 
complexo. Mostre que se 


K 
sup -——— < 1 
w>0 |P(jw)| 


então o critério de Nyquist atesta que o sistema em questão é assintoticamente estável. 
Compare com o critério de Nyquist aplicado com a aproximação de ordem zero para e77", 


Exercício 7.12 Considere as seguintes funções de transferência estáveis 
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p (s + 2) 

a) H(s) = (82 +28+9(s +41) 
BEER e 

b) H(s) = (s2 +2s+2)(s +1) 
oO er 

c) H= (s2 +25 +2)(s L) 


Calcule numericamente as normas Ha e Hoo de cada uma delas pelas respectivas definições 
e através de desigualdades matriciais lineares. 


Exercício 7.13 Considere um sistema linear definido por 2 = H (sŵ e uma realimentação 
não linear w(t) = Alz(t)). Mostre que a sua estabilidade assintótica é preservada se 


|H(slo <7, A(o/A(z) <y 2 


Exercício 7.14 A partir do resultado do exercício anterior, verifique que a origem do 
sistema definido por 


s2+3s s— —e A, 
H(s) = tie + Sie 1) E É, a(o) = (1 no 


(s 41) pe g0 
é globalmente assintoticamente estável. 


Exercício 7.15 Considere um sistema formado por uma planta linear 2 = H (sŵ e uma 
realimentação linear w(t) = —dz(t) com ô ER. Para 


(s= 1)(s — 2) 


dA AR CES VICE) 


determine o valor máximo max de tal forma que a estabilidade assintótica seja preservada 
para todo O < à < ômar, utilizando 

a) o teorema do pequeno ganho 

b) o critério de Routh 
Compare os resultados com o valor obtido a partir do lugar das raízes em relação a ò. 


Exercício 7.16 Um sistema dinâmico com atraso tem a seguinte equação característica 
P(s)+neTº=0 onde k > er >0. Mostre que se 


KS 


rhal < 


OQO 


a sua estabilidade assintótica é preservada. 
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Exercício 7.17 Determine numericamente os valores de ||G(s)||> e ||G(s)|loo para 


Eos 
OO MO E 
sê + 4s? + 4s +ne-7s 


definida a partir dos parâmetros k = Pers? 


Capítulo 8 


Modelagem e Ensaios Práticos 


8.1 Introdução 


Neste capítulo, consideramos dois projetos de cunho prático de sistemas de con- 
trole, a saber: o controle de posição de um sistema mecânico torcional e o projeto de 
amplificadores eletrônicos realimentados. Nos dois casos, nosso objetivo principal é 
desenvolver projetos completos que começam pela obtenção dos respectivos modelos 
matemáticos, passam pelos projetos propriamente ditos e terminam com a validação 
em laboratório de cada uma das soluções propostas. A maior diferença a ser notada 
entre ambos é que a modelagem do sistema mecânico torcional é passível de ser feita 
no domínio do tempo, permitindo-nos escrever suas equações diferenciais em função 
dos seus parâmetros para, enfim, obtermos a função de transferência desejada. Por 
sua vez, a modelagem matemática de circuitos eletrônicos é feita de forma mais 
natural através da sua resposta em frequência, o que também leva à sua função de 
transferência como resultado da etapa de modelagem. 


8.2 Sistema Torcional 


Um sistema mecânico torcional é constituído por três discos metálicos interliga- 
dos entre si por duas hastes de torção, sendo que o disco inferior tem o seu eixo 
conectado a um servomotor através de um sistema de correia e engrenagens. À 
Figura 8.1 mostra de forma esquemática o sistema torcional em consideração onde 
os deslocamentos angulares dos discos denotados por 64, 02 e 03 estão relacionados 


ələ 
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Motor 


Figura 8.1: Sistema torcional 


a referenciais inerciais. As duas hastes flexíveis que unem os dois discos superiores 
são idênticas e, portanto, ambas apresentam o mesmo coeficiente de elasticidade 
torcional kp. A pequena haste que liga o primeiro disco ao motor é suposta ideal 
e, portanto, rígida. Os dois discos superiores são idênticos, com mesmas massas e 
geometria. Desta forma, ambos têm o mesmo momento de inércia J e o mesmo coefi- 
ciente de atrito viscoso rotacional b. O primeiro disco também é idêntico aos demais 
mas está ligado rigidamente a uma engrenagem e esta conectada ao motor através de 
uma correia. Isto faz com que a massa e a geometria do conjunto sejam diferentes. 
Por este motivo, assumimos que o primeiro disco, incluindo os demais dispositivos 
a ele ligados, tem momento de inércia Je e coeficiente de atrito viscoso rotacional 
be. Finalmente, o motor é modelado de maneira bastante simples, isto é, o torque 
que ele coloca na engrenagem é considerado proporcional ao seu deslocamento an- 
gular e é expresso na forma Tm(t) = kmu(t). Na verdade, existe um servomecanismo 
acoplado ao motor que impõe a validade desta relação. O valor da constante de pro- 
porcionalidade fornecido pelo fabricante do equipamento é Km = 14,9253 [Nm/rad]. 


Deve ser observado que essa relação traduz meramente a conveniência de expressar 
o torque produzido em termos de uma escala angular. 


Preliminarmente ao projeto de um controlador para este sistema, devemos obter 
o seu modelo matemático, que consiste em escrevermos as equações diferenciais 
que regem o seu movimento em relação aos referenciais inerciais escolhidos. Em 
seguida, necessitamos identificar os diversos parâmetros físicos que definem o seu 
comportamento dinâmico. Impondo o equilíbrio dos momentos em cada um dos 
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discos obtemos 


, a 

Jedit bed + Kh(01 e 02) Rm E K 

JÖ + bz + Knh(ð2 — 01) + sh(b2 — 83) = 0 = 
JOs, + bÔs, + Kn(Os — 05) = 0 l 


A jável tão expressos 
da uma delas de segunda ordem. Todos os parâmetros e€ variáveis es ' E ageid 
Esq dades. A sua representação de estado pode tam 


'stema Internacional de Uni | ee 
a ppa sem grandes dificuldades. Basta definir o vetor de estado contendo 
ser 


o (t) ĝa € 

osições e velocidades angulares, ou seja, r(t) = |01 (t) va (t) Oa(t) Ort) É () fm ne 

Rê de tal maneira que as equações (8.1)-(8.3) são escritas na pote p n 
dada nos capítulos anteriores E = Ax(t) + Bu(t) na qual a matriz 


define a dinâmica do sistema é dada por 


0 0 0 1 0 0 
0 0 0 0 1 0 
0 0 0 0 0 1 (8.4) 
0 
AS N ekplde Iade Oba 0 i 
kar Ird kh/J 0 —b/J E 
0 kh/ J sk a. 0 O = l 
o passo que a matriz B e Rê”! que multiplica a entrada externa é 
a 
l 5 
B=[0 0 0 sm/Je O o | (8.5) 


sideramos duas saídas distintas, que 


z stado, con 
Para completar a representaçao de e aber, y = Cz com C = Cs E R™”® 


correspondem à variáveis efetivamente medidas, as 


A Cz=[0 0100 O | (8.6) 
ou alternativamente com CLE RIXE da forma 
G=[01000 o | (8.7) 


ável medida é o deslocamento angular do terceiro 


imeiro caso, a vari ERR . 
EOC AUE TO PE | o. a variável medida é O deslocamento angular 
9 


disco 03 enquanto que no segundo cas 


do segundo disco 6», respectivamente. iii dr 
nosso objetivo é obter os parâmetros que : E 
imentos, que passamos à escrev 


atrizes 
Agora, 


(A,B) o que será feito através de dois exper 
3 
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Figura 8.2: Oscilações dos discos 1 e 3 


detalhadamente. No primeiro travamos o disco 2 na posição 0, = 0 e consideramos a 
entrada nula u(t) = O. Em seguida, o disco 1 foi retirado de sua posição de equilíbrio 
e, a partir desta posição, com velocidade angular nula, obtivemos o seu deslocamento 
angular em [rad] dado no lado esquerdo da Figura 8.2. Sob estas condições, o modelo 
matemático do deslocamento do disco l, escrito na forma padrão | 


01 + 2EwnO1 + w20 = 0 (8.8) 
com 2éwn = be/Je, wn = e a mt ; | 
sinto n = be/Je, Wn = Rh / Je e condições iniciais 01(0) = 010, d1(0) = 0, admite a - 

= 210 —EWnt 
H= (ns) e Sun sen(wgt + œ) (8.9) 
em que Wd = wn/1 =e e 
Ewn 


= ygi (8.10) 


Pevermos observar que esse tipo de solução requer 0 < é < 1 o que é perfeitamente 
compatível com a resposta temporal mostrada na F igura 8.2 ser nitidamente do tipo 
subamortecida. Decorrido um certo intervalo de tempo, a oscilação se dá em a 
da posição de equilíbrio 6, = 0. Derivando (8.9) em relação ao tempo, verificamos 
que os pontos de máximo e de mínimo da resposta temporal 0; (t) E nos 
instantes que satisfazem a equação tg(wat + 4) = te(d), ou seja 


wdti = im, i= 0,1,2, (8.11) 
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A primeira parte da Figura 8.2 mostra os pontos de máximo e de mínimo corres- 
pondentes a i = 1,2,---,m = 8 que podem ser usados para determinar o valor da 
frequência natural amortecida wg. De fato, como wa(ti+1 — ti) = 7, O valor médio 
fornece a relação 


(m — 1)r 
SA GST) 
com a qual os valores medidos permitem determinar wa = 33,8847 [rad/s]. Por outro 
lado, nestes mesmos instantes de tempo com (8.9), obtemos 


Wd = (8.12) 


aa =t a d=0,1,2,:-: (8.13) 


fazendo com que os pontos máximos e mínimos indicados na Figura 8.2 satisfaçam 
uma relação independente da condição inicial adotada, isto é 


Piti) e` Eun (ti+ı >ti) 
|01 (t:)| 
= erite(é) (8.14) 


Novamente, calculando a média para os m = 8 pontos disponíveis algumas mani- 
pulações algébricas simples colocam em evidência a igualdade 


(m — 1)r 
Ya aae — aN) 
que em conjunto com a relação (8.10) determina o valor do fator de amortecimento 
£ = 0,0634 e também da frequência natural não amortecida wn = 33,9530 [rad/s]. 


Assim, as relações anteriormente explicitadas determinam os valores numéricos dos 
parâmetros do primeiro disco, a saber 


tgl) = (8.15) 


b 
ce — 43057 [51], n = 1,1528 x 102 [572] (8.16) 


C C 
Ainda neste mesmo experimento, submetemos o disco 1 à entrada constante u(t) = 
0,0402 [rad] durante 3 [s] que é um tempo suficientemente longo para que o referido 
disco atinja a posição de regime permanente 01(t) = Oiperm = 0,2975 [rad]. Desta 
forma, determinamos a relação 


Sm = 7,A005 (8.17) 
Kh 
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O segundo experimento também foi feito com o disco 2 travado na posição 09 = 0. 
Porém, o disco 3 foi levado até uma determinada posição e solto com velocidade 
inicial nula. Com (8.3), verificamos imediatamente que a equação diferencial que 


rege o comportamento dinâmico do seu deslocamento angular pode ser escrita na 
forma 


Os + 2Ewnbs “Ie w203 ==) | (8.18) 


com 26wn = b/J, um = Kh/J e condições iniciais 05(0) = 050, 93(0) = 0. Como esta 
equação é idêntica àquela do disco 1, os resultados e o procedimento anteriores para a 
determinação dos seus parâmetros podem novamente ser adotados. Considerando a 
resposta temporal subamortecida que consta no lado direito da Figura 8.2, obtemos 
wa = 37,7396 [rad/s] e, em seguida, € = 0,0079 e wn = 37,7408 [rad/s]. Com estes 


valores, os parâmetros de interesse 


Ti 5959 [571], “2 = 1,4244 a e 

7 ql x 10º [s74] (8.19) 
são calculados. A Figura 8.2 mostra nos mesmos gráficos as soluções das equações 
diferenciais (8.8) e (8.18) submetidas às mesmas condições iniciais que o sistema real 
e com os parâmetros que acabamos de determinar. Como vemos, a concordância 
dos resultados é bastante boa. Nota-se apenas uma pequena discordância quando 
a velocidade angular do disco 1 é muito pequena, certamente devido à presença de 
atrito seco não modelado que age nos pontos de contato da correia com o motor e 
com a engrenagem que acaba tendo um efeito significativo em baixa velocidade. | 


Exemplo 8.1 As matrizes (A, B) da representação de estado do sistema em estudo podem 
ser reescritas na forma compacta 


0 I 0 
AÅ = == 
[a a ela 


Com os parâmetr ae à 
p etros que acabamos de calcular, Ag € RºX3 e By € R3X1 são dadas por 


1,1528 —1,1528 0 8,5313 
Ao = | —1,4244 2,8488 —1,4244 | x10, Bọ = O | x 10º 
O —1,4244 1,4244 0 


enquanto que a matriz diagonal A, € R?*3 é dada por 


4,3057 0 0 
A O 0,5959 0 
0 O 0,5959 
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Figura 8.3: Diagrama de blocos do sistema em malha fechada 


É interessante verificar que todos os autovalores de A € RºXº têm parte real negativa à 
exceção de um deles que está localizado na origem do plano complexo s = 0. A matriz A 
não é inversível. A conclusão importante é que a função de transferência entre a entrada 
u e a saída y expressa na forma G(s) = C(sI — AJT!B sempre terá um polo na origem 
independentemente da eventual escolha da matriz de saída C € R!*º como sendo igual a C3 
ou Cə definidas em (8.6) ou (8.7), respectivamente. Essa função de transferência sempre será 
do tipo um. Esse fato tem uma implicação interessante, se fizermos u(t) = uo constante para 
todo t > 0, aplicaremos no disco 1, através do motor, um torque constante Tm(t) = Kmuo 
para todo t > 0. Como o disco 3 está solto, após alguns momentos, o conjunto vai girar com 
uma velocidade angular constante. o 


De posse do modelo matemático do sistema torcional em estudo, o nosso objetivo 
é projetar um controlador para que o disco 3 siga um sinal de referência do tipo 
degrau, com erro nulo. A dificuldade é que o torque de controle produzido pelo 
motor é aplicado no disco 1 o qual não está diretamente ligado ao disco que se quer 
controlar. De fato, entre ambos existe uma estrutura flexível composta pelo disco 2 
e por duas hastes verticais. A estrutura de controle escolhida é a de realimentação 
unitária a qual, por comodidade, é novamente mostrada na Figura 8.3. Inicialmente, 
supomos que podemos medir o deslocamento angular do disco 3, que é a variável 
que se deseja controlar, ou seja y(t) = 03(t). Assim sendo, obtemos 


G(s) = C(sI- AJtB 
| 1,7309 x 1010 
= Doo o ee 0) 
s(s + 2,017) (s2 + 2,425 + 1280) (s2 + 1,061s + 4142) 


e, como esperado, verificamos que se trata de uma função de ordem seis com um 
polo na origem, nenhum zero e um ganho extremamente elevado. Como G(s) é do 
tipo um o erro em regime permanente para entrada degrau será nulo mesmo se o 
controlador for o mais simples possível, do tipo proporcional. 

A partir do lugar das raízes de 1+sG(s) = 0 determinamos o ganho e a frequência 
de oscilação como sendo Kose = 0,0839 e wose = 23,4 [rad/s], respectivamente. O 
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período de oscilação correspondente é igual a Tose = 0,2685 [s]. A existência destes 
valores viabiliza, em princípio, a utilização da regra de Ziegler-Nichols, descrita no 


Capítulo 4, para a síntese da função de transferência do controlador C(s). Conside- 
ramos os três casos possíveis: 


e P : Adotamos C(s) = k > 0. Para k = 3x 1074, o sistema em malha 
fechada é estável. Súa resposta ao degrau não é oscilatória, porém o tempo de 
estabilização é de aproximadamente 7 |s], considerado excessivamente grande 
e inadequado. Para «x = 0,0785 o tempo de estabilização é minimizado e cai 
aproximadamente para a metade do valor anteriormente obtido. Porém, a 
resposta ao degrau apresenta oscilações extremamente fortes e inaceitáveis. 


e PI: Com C(s) = «(1+1/Tis) em que T; = 0,2238 [s], verificamos com o lugar 
das raízes que não existe x > 0 para o qual o sistema em malha fechada seja 
estável. 


e PID : Da mesma forma, com C(s) = s(1+1/T;s+ Tas) em que T; = 0,1343 [s] 
e Ty = 0,0336 [s], verificamos com o lugar das raízes que não existe «x > 0 para 
o qual o sistema em malha fechada seja estável. 


Como acabamos de colocar em evidência, neste caso, a regra de Ziegler-Nichols não 
fornece bons resultados. Isso se deve ao fato de que o sistema dinâmico tem uma 
função de transferência de sexta ordem, que é muito complexa para ser adequada- 
mente controlada, com um controlador simples como são os da classe PID. 

A fim de contornar esta dificuldade, propomos determinar um controlador C(s) 
explorando um conceito parecido com o princípio da separação apresentado no 
Capítulo 5. Isso significa realizar um projeto baseado na ideia de determinar duas 
matrizes de ganho de maneira independente. Uma delas pode ser interpretada 
como um ganho de realimentação de estado (que não é inteiramente disponível) 
enquanto que a outra sintetiza um ganho adequado para que o sinal de referência 
possa ser seguido com erro nulo. O cálculo desse ganho foi feito de forma deta- 
lhada no Capítulo 5. Em seguida, apresentamos um procedimento alternativo. Sob 
essa perspectiva, vamos utilizar a ideia apresentada no Exercício 5.10, a qual requer 
parametrizar a função de transferência do controlador na forma 


| 
C(s) = K(s1 s Aeb z0) ) È (8.21) 


em que a matriz K €e R!*º corresponde a um ganho de realimentação de estado 
que aloca os polos do sistema em malha fechada em posições convenientes do plano 


eee 


8.2. SISTEMA TORCIONAL 321 


oae e L c R$X! é o ganho responsável em atuar adequadamente no sinal E 
referência. Para melhor analisar esta proposta, vamos inicialmente dani repre- 
sentação de estado da função de transferência C(s), cuja entrada é o sinal de erro é 
e cuja saída é o sinal de controle à. Com (8.21), obtemos 


te = (A-— LC)zre+ Bu- Le (8.22) 
u = Kre (8.23) 


As demais equações que permitem descrever o sistema em malha fechada e 
tado na Figura 8.3 são & = Ax + Bu, y = Cr, que definem a função padrao pesa 
G(s) e e =r— y, que explicita o erro entre a referência e a variável contro E a. dia 
melhor entendermos o funcionamento deste controlador, a partir do vetor de esta 


m=[2|-| ” | eR” (8.24) 
ec £ — Te | 


escrevemos a equação do sistema em malha fechada na forma 


aumentado 


, A—-BK BK A (8.25) 
Ra | 0 oe , 
y = [C Olza (8.26) 


Ed $ a 
e torna-se aparente que, também para este tipo de estrutura de controle, a su 


equação característica é 
det (s1 — (A — BK) )det (s1 — (A — LC) =) (8.27) 


a qual permite concluir mais uma vez que as matrizes de ganho KeL podem ser 
determinadas de forma independente, para assegurar à estabilidade do sistema em 
malha fechada cuja função de transferência é dada por 


F(s) = c(sI ff BK)) BK (51 n(A LC)) 1 


Il 


c(sI tédio BK)) BKM(5) (8.28) 


com M(s) = (sI — (A — LO) IL. A Figura 8.4 dá uma interpretação para pg 
escrita na forma (8.28) em que se nota perfeitamente a realimentação de estado e 
a função de transferência M (s) atuando sobre o sinal de referência f. E que 
a Figura 8.4 apenas ilustra, conceitualmente, o efeito da funçao de transferencia 
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«> 


r= Ax -+ Bu 


Figura 8.4: Diagrama de blocos equivalente 


do controlador C(s) no sistema em malha fechada. Também é claro que a imple- 
mentação do controle projetado é feita como indica a Figura 8.3, ou seja Ra da 
realimentação do sinal de saída ĝ. Neste ponto, ocorre um fato que é Eveil do 
sistema em estudo. Como desejamos seguir uma entrada do tipo degrau com erro 
de regime nulo, devemos impor F'(0) = 1, o que nos leva à relação não linear 


C(A- BK) !BK(A- LOL =1 (8.29) 


que depende simultaneamente de ambos os ganhos K e L de uma maneira bastante 
complicada. Felizmente, no caso sob análise, esta equação é sempre satisfeita pois o 
sistema em malha aberta G(s) é do tipo um. Para todo controlador C(s) que não 
tenha zeros na origem, o produto C'(s)G(s) terá ao menos um polo em s = 00 que 
assegura, como já sabemos, que a restrição F(0) = 1 seja satisfeita. Neste contexto 
o projeto do controlador que tem como informação as medidas do deslocamento 
angular do disco 3 (C = C3) pode ser dividido em duas etapas distintas, a saber : 


e Determinação de K : Especificamos que o sistema em malha fechada deve 
ter um tempo de estabilização de aproximadamente 4 [s] de tal forma que 
os seus polos devem estar localizados na região Re(s) < —1. Utilizando os 
procedimentos discutidos no Capítulo 5 para o projeto do regulador linear 
quadrático, determinamos os polos do sistema em malha fechada lançando mão 
do lugar das raízes simétrico com (s) = Ca(sI — A)-1B. Para p`! = 0,0060 
determinamos os polos —1,0170 + j64,4192; —4,7959 + 536,6763; —12 0553 SE 
79,9270 e o ganho de realimentação de estado A A | 


K =| 0,0689 0,0071 0,0015 0,0035 0,0022 0,0020 | (8.30) 


que atendem à especificação de projeto acima definida. É interessante notar 


8.2. SISTEMA TORCIONAL 323 


que este ganho é ótimo pois resolve o problema linear-quadrático 


u 


min m (y(t)? + pu(t)?) dt (8.31) 


via realimentação de estado. Ele pode ser indistintamente calculado através 
de alocação de polos ou da solução de uma equaçao de Riccati. 


e Determinação de L : Como qualquer L tal que A-— LC; seja assintoticamente 
estável pode ser adotado, vamos determiná-lo de tal forma que os autovalores 
de A— LC} estejam localizados à esquerda dos autovalores de A- BK. Assim, 
o período transitório do sinal produzido pela referência M (s)f será muito breve 
se comparado com o dinâmica do sistema controlado. Os polos de M(s) devem 
estar localizados na região Re(s) < —4 e para obtê-los traçamos o lugar das 
raízes simétrico com (s) = Ca(sI — AJ“! B. Para p”* = 0,2 determinamos os 
polos —4,1997 + 765,8183; — 15,2227 + j42,4331; —925,9090 + 914,2972 e o ganho 
de realimentação correspondente | 


L'=[ 0,1083 0,1026 0,0852 0,0218 0,3727 3,6266 | x 10º (8.32) 


Devemos lembrar que este ganho também resolve um problema linear-quadráti- 
co do tipo (8.31) porém com um peso p > 0 muito menor, necessário para 
posicionar os polos na região especificada. 


De posse dos valores de K e L, o controlador C (s) está completamente definido. 
Porém, é possível ainda realizar um ajuste fino dos polos do sistema em malha 
fechada, via lugar das raízes, ajustando-se um escalar x > 0, de modo que o novo 
controlador Cp(s) = nC(s) apresente um desempenho ainda mais adequado que 
aquele do controlador original C(s). O traçado do lugar das raízes em relação a 
k > 0 e diversas simulações permitem adotar k = 0,3 o que nos leva à função de 
transferência 

4,9906(s + 6,357) (5? — 3,5325 + 1385) (s? + 2,393s + 4094) 


Eare A a 
e (s2 + 85,375 + 2329) (s2 + 28,295 + 3183) (5? + 7,2425 + 3974) Ram 


Como uma última verificação, calculamos as margens de ganho MG = 15 [dB], 
de fase MF œ 45º e o valor de pico máximo no tempo y = 0,25 impostas pelo 
controlador (8.33). Os valores encontrados são, como sabemos, bastante adequados. 

A Figura 8.5 mostra as respostas temporais do sistema físico (obtida a partir de 
um protótipo montado em laboratório) e do seu modelo (obtida através de simulação 
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Figura 8.5: Resposta a um pulso retangular 


numérica) para uma entrada do tipo pulso retangular. Em t = 0 os discos encontram- 
se em repouso e a referência faz com que o disco 3 siga para a posição desejada 
03 = 2 frad]. Após três segundos, o mesmo disco deve retornar para a posição 
original, isto é, de onde partiu no ciclo anterior. Em linha contínua, observamos 
a resposta temporal do sistema físico, ao passo que em linha tracejada fornecemos 
o resultado da simulação numérica do seu modelo. As seguintes observações são 
pertinentes. Nota-se uma boa concordância entre as respostas temporais do sistema 
físico e do seu modelo matemático. Os valores de pico máximo no tempo e do tempo 
de estabilização estão bastante próximos daqueles estipulados no projeto. Ademais, 
verifica-se que o sistema em malha fechada segue um degrau de posição com erro 
nulo, sobretudo na trajetória de retorno para a posição inicial. Na trajetória de 
ida para a posição desejada, nota-se a existência de um pequeno erro de regime 
permanente causado pelo sistema de acionamento do motor que tem uma zona morta 
como dispositivo de proteção. 

A fim de explorar as diversas vantagens da estrutura de controle que estamos 
utilizando, vamos supor que não seja possível medir o deslocamento angular do disco 
superior 3. Isto é, consideramos que apenas a medida do deslocamento angular do 
disco intermediário 2 esteja disponível para realizar o controle do deslocamento an- 
gular do disco 3, mantendo os critérios de desempenho estabelecidos anteriormente. 
Assim sendo, o projeto pode ser novamente dividido nas duas etapas seguintes : 


e Determinação de K : Como a saída de interesse continua sendo y = Cax 0 


cálculo do ganho de realimentação de estado K permanece inalterado e fornece 
o valor já calculado (8.30). 


e Determinação de L: Como a saída medida é y = Cox devemos calcular este 
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ganho de tal forma que os polos de M(s) sejam bastante rápidos = o 
aos do sistema em malha fechada. Neste o traçamos o lugar das ps 
simétrico com (o(s) = Colsl — AB. Paap = 0,0335 calculamos os A ei 
—1,3364 + 936,2976; —3,8661 + 164,8902; —18,2130 + 715,3807 e o ganho 


realimentação correspondente 


L' =| 36,3999 41,3335 31,6171 63,4726 854,2292 759,5911 | (8-34) 


À primeira vista, deveríamos concluir que os polos dominantes E oo 
constante de tempo = 0,7483 [s]. Isto, porém, não ocorre cai ço ” 
de um par de zeros complexos de (s) situados em —0,2979 l A 
acabam atenuando o efeito dos polos presentes nas suas proximi la o a 
a este efeito, a escolha de L torna-se adequada segundo o criterio adotado. 


Como foi feito no caso anterior, assim que dispomos dos ganhos de o 
K e L definimos o controlador final Cr(s) = nO(s) onde k >0 o E : 
fino do ganho que pode ser calculado através do lugar da ue AF Pu é Gi 
onde G(s) é a função de transferência G(s) = Co(sl — A) e p 


O lecer o valor 
efetivamente medida. Algumas experimentações, nos levam a estabele 


k = 0,3 e calcular O controlador a ele associado 


1,95(s + 6,659) (5? — 0,69285 + 1337)(s2 + 1,2775 + 4242) (8.35) 
Gois (2 + 65,345 + 1721)(s? + 5,3165 + 1409)(52 + 6,4175 + 4456) 


É interessante observar que este controlador impõe ao o “o Fem 
as margens de ganho MG = 17 [dB], de fase M Fx45eo a or e a RA 
no tempo Y = 0,25 que são valores muito parecidos com aque ps o cu A 
anterior, já considerados adequados. Finalmente, E preciBo: Eua ak a 
de solução só é possível pois, para entrada do tipo degrau, em ; 
os deslocamentos angulares 01(t), 02 (t) e 03 C veloso an É físico 
Para a validação final desta proposta de pr porte ge e o 
coimontado em laboratório. A Figura 8.6 mostra 08 Tos i isi 
r do disco superior para uma referência do tipo pulso retangu e 

pe a FR l “Em linha contínua, temos o valor real do referido 


à ST] lise vi indi a excelente 
valores calculados via simulação numérica. Uma análise visual indica um 


| anente. 
concordância entre eles, inclusive para os valores de regime perm 
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Figura 8.6: Resposta a um pulso retangular 


8.3 Amplificador Eletrônico Realimentado 


O projeto de amplificadores eletrônicos realimentados teve uma grande con- 
tribuição de Harry T. Nyquist, que formulou um critério de estabilidade baseado 
inteiramente na sua resposta em frequência. Como já vimos, detalhadamente, o 
critério de estabilidade de Nyquist constitui uma das mais importantes ferramentas 
para a análise de estabilidade de sistemas lineares invariantes no tempo. No presente 
contexto, em função da grande quantidade de transistores utilizados na montagem 
de um amplificador eletrônico, como é o caso dos amplificadores operacionais, é 
inviável substituir cada componente por seu modelo matemático a fim de obter o 
modelo global do circuito. Em razão deste fato, a sua resposta em frequência de- 
termina uma relação entrada / saída que é bastante útil para descrever e projetar 
circuitos eletrônicos em geral e que contenham aqueles componentes citados, em 
particular. 

Como ilustração, consideramos nesta seção o projeto de um amplificador reali- 
mentado segundo o procedimento apresentado no Capítulo 4. Interligamos em série 
o amplificador operacional OP07 com um amplificador de sinal para fornecer um 
alto ganho em malha aberta, conforme indicam os blocos internos à região delimi- 
tada por linhas tracejadas situada mais à esquerda na Figura 8.7. Nosso objetivo é 
determinar a resistência Ry e a impedância Z(s) = Re +1/(sC,) que representa um 

resistor em série com um capacitor, de tal forma que o amplificador daquela figura 
seja estável para uma determinada faixa de valores da relação R4/R3, considerando 
fixos os valores dos resistores Rj e Ro. 


De acordo com dados experimentais fornecidos pelo fabricante, a função de trans- 
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Figura 8.7: Amplificador realimentado 


ferência (em malha aberta) do amplificador operacional OPOY utilizado pode ser 


aproximada por Fa er 
Aal) = Tra + T)(as + 1) 

5 ql = -1 — 1,5 [MHz]. Portanto, ao construirmos 
ap E Pe a E na pda não-inversora, rapá 
pondera operacional com função de transferência Aals) € o À = E ga A : 
conforme o segundo estágio mostrado na Figura 8.7, a sua função de tran | 
fd Aa(s)/t (8.37) 
Fa(s) = Hq EE An(s)/u 
Desta maneira, adotando-se Os seguintes valores para as rp pa E 7 
o. An ig i e n o mais à esquerda 
amplificador diferencial delimitado pela linha tracejada que ap 
na Figura 8.7 tem a função de transferência 


A(s) e Aa(s) Fa(s) (8.38) 


j x atro 
cujo ganho em baixas frequências é a a n Les pe e 
; Zj; ) J 
j deles com constante de tempo 2 Hz]; , 

e É interessante observar que como An(s) 
MHz|, res ectivamente e nenhum Zero. | í n 

a ça segunda ordem assintoticamente estável, o mesmo ocorrerá c 

é 


a ser determinada. Além disso 
9 
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Fa(s) | 
a para ualqu à 
quarta o E o u > 1 que se queira utilizar. Entretant 
m, o mesmo não ocorre se a funçã o, por ser de 
interior de uma malha d e de transferência A(s) tor colocad 
E ad a e realimentação, como aquela ilustrada na ins 8.7 ES 
, O à o g 
inicialmente aquele circuito sem o compensador, i 4 o 
or, isto é, fazendo 


R, =0 e Rr = : 
y e Ry = 00, verificamos q a 
ue a sua função d ênci 
. ; e tr m 
pode ser escrita na forma padrão i A ate da do 


F(s) E «CAS Á(S) | 
A +C(s)A(s) (8.39) 


na qual C(s) = 1/s com k = 
volvimento des no aba F R4/R3 > 1, em conformidade com o desen- 
E a A o o 4. Neste caso, o lugar das raízes da equação 
EE E z permute verificar que se o ganho for suficientemente 
A E A ON na Ea o torna-se instável. Na prática, isso se traduz 
ou seja, fora da região de valid a DE Rd 
k = 10, o circuito é estável o modelos lineares que temos adotado w 
EN pa A ba fire margem de ganho MG = 6 [dB], mergem 
ia ua aa Lipo [kHz]. Como sabemos, este valor de margem 
nto E adequado, e por conseguinte não pode ser tomado 
Desta forma, é preciso projetar um 
do circuito. Adot compensador para melhorar o dese 
na Ena e eia definido por um resistor série E 
com um capacitor Cr À A gp A pin série de um aa a 
direita na Figur ; l ada pela linha tracejada situad is à 
pno a o no > interior o compensador cuja conexão o o 
opor iida ia e a inar feito no Capítulo 4. Ademais, naquela mesm 
A aa necessidade de que a hipótese adicional Ry & R; a 
eita. Em caso afirmativo, a função de transferência F(s) do o 


completo em malha fechada é 
ai é novamente dad z 
Ens Rs doa pensador a por (8.39), porém com a função de 


Cen E E Cd 
altas td 
Tus + 1 (8.40) 


as duas const 
faia Ê antes de tempo dest E 
ambém as po desta funçã 
devem atender a restrição Ty < Ty, O Bia A ção de trans- 
projetar um compensador do tipo atraso. Fi E y, O que implica em termos que 
3 . Finalmente, explici , 
tivos de projeto que são os seguintes: , explicitamos os nossos obje- 
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ə O amplificador deve ser estável para « € (1, 100). 
e Sua margem de fase deve ser maior ou igual a 45º. 


e Sua largura de faixa deve ser W = 75 [kHz]. 


Comparando essas especificações, a serem atendidas pelo amplificador com com- 


bidos pelo amplificador não compensado com O ganho 


pensação, com OS valores exi 
nominal x = 10, notamos que às duas primeiras relativas à estabilidade e à margem 


de fase são muito mais exigentes para Se ter certeza que, na prática, O circuito possa 
funcionar de forma adequada. Em contrapartida, aceita-se uma largura de faixa 
menor, porém que deve ser válida para uma variação de ganho bastante apreciável. 
Finalmente, devemos notar que à restrição sobre O domínio de estabilidade em função 
do parâmetro K > 0 pode ser traduzida em termos do conceito de margem de ganho. 
Ou seja, podemos fazer o projeto de C(s) para um valor nominal k = 10 e impor 
uma margem de ganho tal que MG > 20 [dB] a qual, como sabemos, é determinada 
pelo produto de funções de transferências C (s)A(s). Para futuras comparações, à 
Figura 8.8 mostra em tinhas tracejadas os diagramas de Bode de módulo e de fase 
de A(s)/ com O ganho fixado no seu valor nominal « = 10. 

Para impor uma largura de faixa W = 75 [kHz], devemos fazer com que O 
cruzamento do diagrama de Bode de módulo com 0 [dB] ocorra em wg = 2/3W = 
50 [kHz]. Ademais, devemos ficar atentos para que O diagrama de fase não sofra 
grandes alterações no entorno do valor de wg, a fim de garantirmos a margem de 
fase desejada. O procedimento para determinarmos C (s) considerando o ganho 


nominal «x = 10 é dado a seguir: 


1. A fim de fazermos com que o zero do controlador atenue o efeito do polo 


da planta, alocamos esse zero (de fase mínima) em 5,9 [Hz] escolhendo Ty = 
0,18 [s]. Diversamente do que fizemos no Capítulo 4, escolhemos 7x LT = 
0,5 [s] para tentar encontrar uma solução sem que ocorra o cancelamento do 


polo mais lento de A(s) com o zero de C(s). 


2. A fim de que atender o critério da largura de faixa desejada, escolhemos O 
valor da frequência Ty l para que wg 5 50 [kHz] e respeitando, simultanea- 
mente, a condição de margem de ganho. Após algumas tentativas, em cada 
uma das quais calculamos numericamente a margem de ganho e a margem de 
fase com C(s)A(s) para diversos valores de Ty, determinamos Ty = 1,38 [s], 


correspondente à Wg = 49,37 [kHz]. 
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[Hz] 


Figura 8.8: Resposta em frequência do amplificador 


Portanto, ao final do procedimento obtemos o compensador 


1 018s41 
C S) EK DESNE 
(5) 1,38s + 1 (8.41) 


que garante uma largura de faixa W = 74 [kHz] 
e uma margem de ganho MG ~ 24 [dB] 
de desempenho estipulados. 

diagramas de Bode para o si 


uma margem de fase MF ~ 71° 
o satisfazendo, portanto, todos os critérios 
a Figura 8.8 apresentamos em linhas contínuas os 
| stema em malha aberta co l 
| | | mpensado C(s)A(s) e 
rim Ea os mesmos diagramas para o sistema não a A ns 
K. E importante salientar que w i | 
a g pertence ao intervalo de frequências no q 
a | iual 
a rg de modulo assintótico é —20 [dB/dec]. Como Rê 
m muito detalhes no Capítulo 4, essa f | 
| Eee propriedade a ser perseguida Ig 
projeto similar a este, contribui $ pie ar 
| para que a mar Ircui 
pc q gem de fase do circuito compensado 
Conhecida a função de transferência do controlador C'( 


| s) podemos calcular o 
resistor Ay e o capacitor C} através das expressões 


Ty — T, 
— y £ Ty 
Cr =", Rr = 


R, TER Ry (8.42) 


Empregando O mesmo raciocíni as 
ocinio utilizado no Capítul PR = 
91 [kQ] e fazer com que R4 = pítulo 4, devemos arbitrar R3 = 


= (k — 1)R3 = 450 [k9], de modo que ao definirmos 
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Ry = 100 [kN] temos R,/(R3 + R4) = 0,19 para a situação nominal. Feitas essas 
escolhas obtemos empregando (8.42), os valores Cy = 12 [uF] e Rz = 15 [kQ]. Neste 

onto, cabe ressaltar um importante aspecto prático que se deve observar no projeto 
de C(s). Trata-se da determinação do valor da capacitância Cy, a fim de que ele 
seja compatível com os valores comerciais disponíveis e com as dimensões físicas do 


circuito eletrônico. 

Utilizando dois amplificadores operacionais OP07 comerciais, o circuito mostrado 
na Figura 8.7 foi montado para podermos fazer algumas comparações e avaliações. 
Em todas as situações, aplicamos uma entrada ve(t) como sendo uma onda quadrada 
com amplitude 100 [mV] e período 4 [ms]. Nas experiências realizadas e descritas 
a seguir, os resultados obtidos em laboratório foram comparados com os previstos 
pelo modelo que temos utilizado para descrever o comportamento dinâmico do am- 
plificador que acabarmos de projetar. Para ve(t) dada, com (8.39) obtemos a saída 
correspondente 


re El) tA) (8.43) 


sendo que em F(s) adotamos C(s) = 1/k para o circuito não compensado que é 
implementado impondo-se um curto-circuito na resistência Ry e retirando do circuito 
a impedância Z(s) e, C(s) dada por (8.41) para o circuito com o compensador. 
Nas Figuras 8.9 e 8.10, mostramos a saída vs(t) do circuito implementado no la- 
boratório, em linhas continuas, e a mesma saída prevista pelo modelo (8.43), em 
linhas tracejadas. O lado esquerdo de cada figura mostra as respostas do circuito 
não compensado enquanto que o lado direito de cada uma delas mostra as respostas 
do circuito com o compensador. 


e Ganho nominal : Para x = 10, a Figura 8.9 deixa claro que o modelo 
matemático utilizado é bastante realista e preciso. Nota-se claramente que 
devido à margem de fase de 71º para o circuito compensado, a sobre-elevação 
do sinal não chega a 20% do valor de regime, ao passo que no circuito não 
compensado a sobre-elevação é próxima de 507%. 


e Limites de estabilidade : O lado esquerdo da Figura 8.10 mostra a res- 
posta do circuito não compensado para o ganho K = 5,2 situado no seu limiar 
de estabilidade. O modelo matemático continua a fornecer bons resultados 
pois, verificamos no laboratório que para um ganho ligeiramente menor os 
amplificadores saturam. No lado direito, nota-se que o circuito compensado 
ainda funciona adequadamente para x = 2, pois esta redução de ganho é 
perfeitamente suportada pela margem de ganho de 23 [dB] do compensador 
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t [ms] t [ms] 


Figura 8.9: Respostas para o ganho nominal 


nominal. A sobre-elevação da resposta é natural tendo em vista que, nos dois 
casos, os ganhos estão próximos dos respectivos limiares de estabilidade. 


O leitor deve ter observado que não há grandes dificuldades para se projetar 
um compensador do tipo atraso como este que acabamos de considerar. De fato, a 
função de transferência C(s), dada em (8.40), depende apenas de dois parâmetros 
desconhecidos Ty € Ty que são determinados com o objetivo de cumprir os critérios 
de desempenho estabelecidos. Em princípio, com tão pequeno número de incógnitas 
ela até poderia ser determinada por tentativa e erro. O bom senso e requisitos 
básicos como aquele de fazer com que a frequência que define a margem de fase se 
situe em uma faixa onde o módulo cai 20 [dB/dec| são essenciais para simplificar 
a obtenção do compensador final. Desempenhos melhores poderiam ser atingidos 
com C(s) mais sofisticadas, isto é, com maior número de zeros e de polos mas com a 
consequente dificuldade de implementação prática, que certamente requereria uma 
impedância Z(s) de maior ordem. | 

Desejamos terminar este capítulo com uma pequena discussão a respeito do fu- 
turo, no que diz respeito à implementação prática de sistemas de controle. Como 

afirmamos no início deste livro, existe uma tendência de que os controladores C(s) 
deixem de ser implementados de forma analógica, dando espaço ao chamado con- 
trole digital. Com o desenvolvimento de microprocessadores cada vez mais potentes 
e rápidos, a implementação deixará de ser física para se tornar lógica. Um contro- 
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vet 


© 
m þa 
p> 


t [ms] | t [ms] 


Figura 8.10: Respostas nos limites de estabilidade 


dos aspectos de base que aqui procuramos explicitar. 
84 Notas Bibliográficas 


O desenvolvimento de bons projetos depende de arte, perseverança, an 
e de se ter em mãos bons modelos matemáticos que descrevam com precisao e 
que se deseja controlar. O livro [27] precisa ser lido pelos que E eder 
modelagem matemática de sistemas dinâmicos em geral. Além : ser pa a 
simples e agradável, ele contém uma miríade de modelos que al disto soa 
diversas áreas do conhecimento. Da mesma forma, embora seja mais res a 
[16] também fornece uma visão bastante ampla a respeito da De a 
Especificamente, para um estudo mais aprofundado de mecânica, o liv ne 
referência obrigatória enquanto que para estudos mais voltados para pio gi ip 
elétrica devemos citar [6] para circuitos elétricos, [29] para dispositivos s pra 
[34] para microeletrônica. Os livros [12] e [31] fornecem informaçoes n 
modelos e controle de sistemas de potência. Por fim, certos detalhes imp 
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quanto à implementação prática de projetos de sistemas de controle podem ser 
conseguidos nos textos [2] e [19] sendo que, em particular, no segundo livro citado, 


diversos aspectos relevantes de controle por computador são discutidos e analisados 
em detalhes. 


a) Determine a solução y(t) para todo t > O e mostre que ela pode ser escrita de duas 


formas equivalentes : 


y(t) = y(oo) (1 = er) » y(t) = y(0)r (1 = E 


tir de y(t), supondo 
b) Estime os valores da constante de tempo T e do ganho k, a aa pe ii 
8.5 E íC] que T seja grande o suficiente para que o regime permanente tenha s ' 
. Xercicios 


c) Estime os valores da constante de tempo T e do ganho K, a partir de o no 
T não seja grande o suficiente para que o regime permanente tenha sido alcançado. 


| , TET ta G(s) do sistema 
Ras l ; Pas transferência em malha aber 

Exercício 8.1 Considere o sistema torcional com o terceiro disco preso no teto através Exercício 8.5 Considere a função de f 

de uma haste flexível com coeficiente de elasticidade torcional Kt. torcional dada em (8.20). 


| 7 ea É 

a) Determine as equações do seu modelo matemático. a) Determine o lugar das raízes para 1 + KG(s) 

b) Considerando que a velocidade angular do terceiro disco seja a grandeza de interesse, b) Determine Kose € Wose- | Za a 
determine a equação de estado do sistema torcional. c) Com a regra de Ziegler-Nichols determine o controlador proporcional C(s) = fp. 

c) Escreva a matriz A € R$X8 na forma do Exemplo 8.1. A matriz A é não singular? 


€ d) Com o controlador proporcional obtido no item anterior, determine o o 
gas dA a sistema em malha fechada para uma entrada degrau de amplitude 2 [rad]. p 
fci va A , om aquela apresentada na Figura 8.5. 
Exercício 8.2 Considere a equação diferencial de segunda ordem Í i | E E enbnia 
: torcional com função de 
j ; Í -6 Considere o controlador do sistema 
01 + 2Ewnby +w20 =0 Exercício 8 


Ce(s) dada em (8.35). Determine: 


tin É para vio do E 8 ida 03. 
a a (0) = Bro e fo a) A função de transferência em malha fechada entre a entrada u e a saída 03 


9) Mostre que ela tem como solução a função Or (£), dada em (8.9). | b) A margem de fase e a largura de faixa exatas impostas por este controlador. 


) . ; i ntrolador, 
b) Determine os instantes de tempo nos quais O1(t) tem derivada nula. c) A margem de fase e a largura de faixa aprorimadas impostas por este co 


; ~ , ; 77 los dominantes. 
c) Qual é o valor da função em cada instante de tempo determinado no item anterior? | adotando a aproximação de polo 


Exercício 8.3 Considere as fórmulas 


| l . gura 8.7, considere que 
(8.12) e (8.15) que permitem estimar os valores da | Exercício 8.7 Para o amplificador realimentado apresentado na Figur 
frequência natural amortecida wa e do fa 


í > > 1 podem ser mudados pelo 
tor de amortecimento é através do cálculo de tg(o) ele não está compensado e que ambos os ganhos u > lexKx>ip 

; : a 5 . / and ; E d s qa- 
“ E nd e PE nai dio a) Determine a equação característica do sistema em malha fechada em função dos g 

(0): | 
| | | | l ã li ssintótica 
/ a o Ea Fe Pd naquelas fórmulas para levar em conta AGE b) No plano de parâmetros k x u determine a região em que a estabilidade a 

no do amplificador é garantida. 


projetista. 


nhos u e de g. 


e | se ; | Bio dá Ed | : ravés do 
Exercício 8.4 Um sistema dinâmico estável cujo modelo matemático é de primeira ordem Exercício 8.8 Considere o amplificador realimentado que seja compensado at 


Pe = au compensador com função de transferência dada em (8.41). 


| s margens de 
p l k = 10, determine a sua largura de faixa e as sua 

foi submetido a uma entrada degrau com amplitude ug conhecida, a partir da condição inicial a) Para o ganho nominal s 

y(0)=0. A resposta correspondente y(t) foi registrada para todo t € [0,7] 


ganho e de fase. Compare os valores obtidos com aqueles fornecidos no texto. 
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b) Refaça o item anterior para k = 50. 


c) Refaça o primeiro item para k = 


r realimentado que sej 
je a compensad 5 
compensador com função de transferência p o através de um 


Cp | Apêndice A 


que é ligeiramente diferente daquela proposta em (8.41) 


a) Para o ganho nominal k = 10, det 


cdr ermine a sua largura de faixa e as suas margens de | | Desigualdades Matriciais 
b) Refaça o item anterior ara K = 1 
) Refaça o it terior p 50. Lineares 


c) Refaça o primeiro item para k = 5. 


d) Compare com os resultados obtidos no 
controlador proposto no texto, tendo em 
devido à precisão dos componentes elétr 


Exercício 88 e conclua sobre a robustez do 


vista a eventual variação dos seus parâmetros 
tcos utilizados. 


Este apêndice é inteiramente dedicado ao estudo das chamadas desigualdades 


| ninar o o amplificador realimentado que seja compensado através do | matriciais lineares. Verificou-se, nos últimos anos, a sua grande utilidade para a 
r atraso dado o | E E 3 io É = A : 

| PE eo no Exercício 8.9. Para o ganho nominal k = 10, refaça o gráfico solução de diversos problemas das áreas de controle e de otimização. A referência 
| .J e compare ; j j | 

| pare com aquele obtido com o compensador fornecido no terto Comente [5] traz um farto material a respeito deste tema. Aqueles que desejam se aprofundar 


neste assunto, devem consultar a referência mencionada, a qual, inclusive, foi uma 
| das primeiras a colocar em evidência a importância das desigualdades matriciais 
| lineares no âmbito da análise e da síntese de sistemas de controle. 
Uma desigualdade matricial linear é expressa na forma 


A(x) < 0 (A.1) 
com 
n 
| i=1 
onde Ao E€ R™®X™” e A; e RPM 4=1,---,n são matrizes reais simétricas e x; € R 


é a i-ésima componente do vetor x € R”. É imperativo entender que A(x) : R” — 
R”*” é uma função linear do vetor x € R”. Ademais, para cada x € R” a matriz 
A(x) é simétrica e a desigualdade (A.1) exige que ela seja definida negativa. Como 
sabemos, isto é equivalente a impor que z'A(x)z < 0 para todo z £ 0 € R”. 


Lema A.1 O conjunto dos vetores x € R” que satisfazem a desigualdade matricial 
linear A(x) < O é convexo. 
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Prova : Como sabemos, um conjunto é convexo se a ele pertencer o segmento 
de reta que une quaisquer dois de seus pontos. Considerando dois pontos genéricos 
£1, £2 E€ R”, os pontos do segmento que os une são dados por x = ax, + (1 — a)xs 
com 0 <a < 1. Assumindo que A(x,) < 0 e A(x5) < 0, obtemos 


Alx) = Alar+(1- axo) 
= aA(xi)+4+ (1 — 0) A(xo) 
< 0 (A.3) 


onde utilizamos a linearidade para obter a segunda igualdade. A desigualdade ocorre 
pois « e 1 — a são número não negativos e não simultaneamente nulos. oO 


É preciso ficar atento para um fato importante. Muito embora a função matricial 
A(x) seja linear, o conjunto A(x) < 0 pode traduzir restrições altamente não lineares, 
como por exemplo, descritas por polinômios ou frações racionais. Este fato fica mais 
claro a partir do seguinte resultado que é fundamental neste contexto. | 


Lema A.2 (Complemento de Schur) 4 desigualdade matricial linear 


A(x) = Va Q(x) <0 (A.4) 


é equivalente a qualquer das duas seguintes desigualdades não lineares: 
a) S(x) <0 e Q(x) — V(<Y S(x) tV (x) < 0. 
b) Q(x) < 0 e S(x) — V (£)Q(£) tV (£Y < 0. 


Prova: Para provar a primeira parte, consideramos x € R” arbitrário e observamos 


que S(x) < 0 também implica na existência de sua inversa S(x)!. Assim sendo, a 
matriz 


U(x) E TE i (A.5) 
é não singular e permite obter a fatoração A(x) = U (x)B(x)U (xy, onde 
— | (x) 0 
B5] 0 Qla) -= Veye) Ve) e 


Portanto, a matriz A(x) é definida negativa se e somente se o mesmo ocorrer com 
B(x) que é o resultado desejado. A segunda parte é provada de forma idêntica. O 
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O Complemento de Schur é uma das mais poderosas np 
para tratar desigualdades matriciais lineares. Ele permite Convertor esigua E 
muito complexas em desigualdades matriciais lineares equivalentes, pi nara 
mensões mais elevadas. No lema acima as submatrizes S(T); Via) e Q(x) s da 
dimensões compatíveis mas arbitrárias. Os seguintes exemplos ilustram os conce 


que foram até aqui introduzidos. 


Exemplo A.1 O sistema de desigualdades lineares 211 + dio < Ê E Es ço : o 
4xo < —4 pode ser escrito como (A.1), onde Ao = diagi—7, —5, h H1 oi 
e Ao = diag{3,1,—4}. Na verdade, qualquer sistema. linear de o a 
escrito como uma desigualdade matricial linear on G as matrizes a Ê a RR 

A desigualdade não linear (= 1)2+2(x9—2)* < 5 , que € O PE a u sa a do 
foco no ponto (1,2), pode ser convertida em uma desigualdade matricial near. AP 


o Complemento de Schur, ela é equivalente a 


axo — 2) -25 q —1 | "T, 
xı — 1 —1 


j 1r mais obtemos 
e aplicando o Complemento de Shur uma vez 


—25 xı—1 z2—2 
Asp and + 0 <0 
T2 — 2 0 —1/2 


| ° i í i R e . . ] Fi ] | e 


origem e pelo seu centro, basta considerar 


25 = E 2 0 
A G= es O ip 0 
0 0 O £ — 271 


trições é 


a maior dimensão da desigualdade matricial linear obtida. 


A 


Exemplo A.2 A restrição AZB + B'Z'A' < —S, onde Z € RP% éa o e é 
B. S são matrizes dadas de dimensões compatíveis é uma desigualdade E inear. 
Coletando os n = pq elementos de Z no vetor x € R”, podemos escrevê-la na forma 


n 
VE = ; Ai 
įi=1 


ectivas 
de Z; € RP*%4 são matrizes que colocam os elementos do vetor x nas suas resp 
o içã forma padrão (A.1) com Apa De 
posições na matriz Z. Aquela restrição se escreve na 
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AÅ: = . LFI A! ; 
He 5 para todo à = 1,.-:,n. Para Z quadrada e simétrica, o mesmo 
PROTONA otado com os n = p(p + 1)/2 elementos distintos de Z € RPXP, o 


Os concei ~ 
doa celtos que acabamos de apresentar são também muito importantes no 
Ito de a sti 
programaçao matemática para resolver problemas de otimização do tipo 


inftc'a : A(x) < 0} (A.T) 


emi que c E E O fato de que a função objetivo seja linear não é uma limitaçã 

seria pois variáveis adicionais e a aplicação do Complemento de Schur viabili Ei 
tratamento de uma vasta gama de problemas. Um outro ponto digno de a i 
consideração do conjunto aberto A(x) < 0 no lugar do fechado A(x) 0. O s 
que os procedimentos numéricos disponíveis e já implementados em e a i 
computacionais usam métodos de pontos interiores para a solução de (A.7) o E 
O nome indica, a solução assim calculada estará sempre no interior do E 
factibilidade mas arbitrariamente próxima da solução ótima global RR 

Passamos, em seguida, a estudar problemas mais específicos a podem ser col 

cados na forma (A.7). O primeiro deles diz respeito ao cálculo da norma IH E em 
spa = C(s] “AB E Ho. Neste sentido, é preciso notar que se X > 0 ea 
az +FÃA+C'C <0 então lH < Tr(B'XB). De fato, se X > 0 é factível 

existe S > 0 tal que AX +XA+C'C=-S e assim | o 


X = / HCO + Sed 
O 


oo 

> / e^ tO'Ce^tdt (A.8) 

Presa E S o i E E positiva da equação de Lyapunov 
IHI} = T(B'PB) 

< Tr(B'XB) (A.9) 

Po r nr obter a norma desejada através da solução do problema de 


o / 
inf DA + AX XAO = 0! (A.10) 


ue é exatam i : 
w i ente do tipo (A.7) pois o traço de uma matriz é uma função linear dos 
elem Rca 
entos. De maneira similar, a mesma norma pode ser calculada, através de 


inf [D(CYC') : AV+YA EBB' < 04 (A 11) 
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É preciso dizer que o cálculo direto da norma Ho, como preconizado pelo Teorema 
7.1, é mais eficiente do ponto de vista numérico e, sempre que possível, deve ser 
adotado. 

Para o cálculo da norma ||H||2, da função racional H(s) = C(sl — AJ IB E Ho, 
utilizamos diretamente o resultado do Teorema 7.2. Ele atesta que ||H o a 
se existir P > 0 que satisfaz a desigualdade de Riccati 


A'P+PA+yu!*PBB'P+4C'C<O (A.12) 


que pode ser convertida, aplicando o Complemento de Schur, em uma desigualdade 
matricial linear equivalente em relação a ambas as variáveis (P, u). Consequente- 


mente 


/ ) 
A'P4+PA+CC PB sn (4.13) 


2 ums : 
Io = inf qu: p'P w 


que é um procedimento numérico bastante eficaz para o cálculo desta norma. Ob- 
serve que a solução conjunta em relação às variáveis P e u evita que algum tipo de 
processo iterativo adicional precise ser adotado. 

Uma outra situação, um pouco mais complexa do ponto de vista numérico, é 
encontrada na determinação do atraso máximo solução do problema de otimização 


(7.59), ou seja 


doe UNE == AP + PAo + A'C'RCA PET cê A 
P>0,R>0,7>0 TBP = 

em que se nota que a sua restrição não é uma desigualdade matricial linear em 
relação a todas as variáveis. Porém, como ela se torna uma desigualdade matricial 
linear quando 7 > 0 é fixado, a sua solução ótima pode ser calculada via busca uni- 
dimensional em relação a este escalar. Para cada 7 > 0, resolve-se (A.14) em relação 
às demais variáveis e aumenta-se T > 0, progressivamente, até que a factibilidade 
seja perdida. 

Esses são apenas alguns exemplos que colocam em evidência a utilidade das 
desigualdades matriciais lineares. Muitos outros existem, por exemplo, a procura de 
uma solução P > 0 diagonal que satisfaça a desigualdade de Lyapunov A'P+PA < 0 
pode ser formulada como um problema do tipo (A.T) e o mesmo ocorre com a 
verificação se uma dada função de transferência racional é ou não positiva real. 
Muitos problemas importantes que vão além do escopo deste livro podem ser melhor 


entendidos e resolvidos com esta técnica. 
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